Gene YpAngola_A1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1037
Symbol	aroP2
ID	5799500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	1061631
End bp	1063028
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	48%
IMG OID	641339025
Product	aromatic amino acid transporter
Protein accession	YP_001605597
Protein GI	162420665
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.725191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.852119
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATC AACAAGAGGG TGCTGAGCTA AAACGGGGGC TTAAAAACCG CCATATTCAG 
CTTATTGCCC TAGGTGGTGC AATTGGTACC GGACTATTCC TCGGCATAGC ACAGACCATC 
AAAATGGCTG GGCCTTCGGT TTTACTGGGG TACGCAATTG GGGGTTTTAT TGCGTTTCTG 
ATAATGCGCC AGCTAGGCGA AATGGTGGTT GAAGAACCTG TAGCCGGTTC CTTTAGCCAC 
TTTGCGTATA AATATTGGGG ACACTTTGCC GGTTTTGCTT CTGGCTGGAA CTACTGGGTG 
CTGTATGTGT TGGTGGCGAT GGCCGAACTA ACCGCAGTGG GGATCTATGT GCAATATTGG 
TGGCCAGAAA TCCCTACCTG GGTCTCCGCC GCCGTCTTCT TCTTGGCCAT CAACGCCATC 
AACCTGGCTA ACGTAAAAGT CTATGGTGAG ATGGAATTTT GGTTTGCCAT CATTAAAGTG 
ATCGCGATTA TTGCGATGAT TTTATTTGGC GGTTACCTGC TCATCAGTGG CCGGGGTGGC 
CCAGAAGCCA CGGTAACCAA CTTATGGGCC CAAGGCGGTT TCTTCCCGAA TGGCATCATG 
GGTCTGGTGA TGGCAATGGC GGTAATTATG TTCTCTTTCG GTGGCCTTGA ATTAGTGGGT 
ATCACCGCAG CAGAAGCAGA AGACCCGGCC AAAAGCATTC CGAAGGCAAC CAATCAGGTT 
ATCTACCGTA TTCTTCTGTT TTATATTGGT TCTCTGGCAA TCTTGTTATC ACTCTACCCA 
TGGGGAAAAG TGGTCGAAGG CGGCAGCCCA TTCGTATTGA TTTTCGATGC GCTGGACAGT 
AATTCAGTCG CCACTGTCTT GAATATTGTC GTACTGACGG CGGCACTCTC GGTCTACAAC 
AGTTGCGTAT ACTGTAACAG CCGCATGTTG TTTGGTTTAG CTAAACAAGG TAATGGCCCG 
AAAATCCTGT TGAAAGTGGA TGGCCGAGGT GTTCCAGTCA TTGCGATTGC TGTTTCTGCG 
TTTGCTACCG CGTTTTGTGT ACTGATTAAC TACCTGTTAC CTGGCCGTGC CTTTGAATTA 
CTGATGGCAT TAGTGGTATC CGCGTTGGTG ATCAACTGGG CGATGATTAG CCTGGCACAC 
CTGAAATTCC GTGCGGCGAA AAACCGCCAG GGCGTAATAC CAAAATTCAA AGCATTTTGG 
TATCCGTTCG GTAACTGTTT GTGTTTGTTG TTCCTGACCG GCATCTTAGT GATCATGTTT 
CTGACACCCA GCATCCGGAT TTCAGTGATA CTTATTCCTG TCTGGGTAGT CGTCCTAGCG 
ATTGGTTATA TTCTGAAGAA TCAGAGCCAA CGTCAGAATC AGCAACTGAG CGCTAGCAGC 
AGGAAAGTAA CCAAGTAA

Protein sequence

MSDQQEGAEL KRGLKNRHIQ LIALGGAIGT GLFLGIAQTI KMAGPSVLLG YAIGGFIAFL 
IMRQLGEMVV EEPVAGSFSH FAYKYWGHFA GFASGWNYWV LYVLVAMAEL TAVGIYVQYW 
WPEIPTWVSA AVFFLAINAI NLANVKVYGE MEFWFAIIKV IAIIAMILFG GYLLISGRGG 
PEATVTNLWA QGGFFPNGIM GLVMAMAVIM FSFGGLELVG ITAAEAEDPA KSIPKATNQV 
IYRILLFYIG SLAILLSLYP WGKVVEGGSP FVLIFDALDS NSVATVLNIV VLTAALSVYN 
SCVYCNSRML FGLAKQGNGP KILLKVDGRG VPVIAIAVSA FATAFCVLIN YLLPGRAFEL 
LMALVVSALV INWAMISLAH LKFRAAKNRQ GVIPKFKAFW YPFGNCLCLL FLTGILVIMF 
LTPSIRISVI LIPVWVVVLA IGYILKNQSQ RQNQQLSASS RKVTK