Gene EcE24377A_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0114
Symbol	aroP
ID	5586474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	121752
End bp	123122
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	53%
IMG OID	640923843
Product	aromatic amino acid transporter
Protein accession	YP_001461280
Protein GI	157156546
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00114785
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGGTC AACAGCACGG CGAGCAGCTA AAGCGCGGCC TTAAAAACCG CCATATTCAG 
CTTATCGCGC TGGGTGGCGC GATAGGGACC GGGTTATTCC TGGGTAGCGC CTCCGTAATA 
CAGTCCGCAG GGCCAGGGAT TATCCTGGGT TACGCCATTG CTGGTTTTAT CGCCTTTCTG 
ATCATGCGTC AGCTGGGTGA AATGGTGGTC GAAGAACCTG TCGCAGGCTC CTTTAGCCAC 
TTTGCTTATA AATACTGGGG CAGTTTTGCC GGTTTCGCCT CTGGCTGGAA CTACTGGGTA 
CTGTACGTTT TAGTTGCCAT GGCTGAGCTG ACTGCCGTGG GTAAATACAT TCAGTTCTGG 
TATCCGGAAA TCCCCACCTG GGTTTCTGCC GCCGTATTCT TTGTGGTGAT TAACGCCATC 
AACCTGACCA ACGTTAAAGT GTTTGGCGAG ATGGAGTTCT GGTTTGCCAT TATCAAAGTT 
ATCGCGGTGG TAGCGATGAT CATCTTCGGC GGCTGGCTGC TATTCAGTGG CAACGGCGGC 
CCGCAGGCGA CCGTTAGCAA CCTGTGGGAT CAGGGTGGTT TCCTGCCGCA CGGCTTCACC 
GGGCTGGTGA TGATGATGGC GATTATCATG TTCTCGTTCG GTGGTCTGGA ACTGGTGGGG 
ATCACCGCAG CAGAAGCTGA TAACCCGGAG CAAAGTATAC CGAAAGCAAC TAACCAGGTT 
ATCTACCGCA TCCTGATTTT CTATATTGGT TCGTTAGCCG TTCTGCTCTC ACTGATGCCG 
TGGACCCGCG TTACCGCCGA TACCAGTCCG TTTGTGCTGA TCTTCCACGA GTTAGGCGAT 
ACCTTTGTGG CGAATGCGCT GAACATCGTG GTACTGACTG CGGCGCTCTC CGTGTACAAC 
AGCTGCGTAT ATTGCAACAG CCGTATGCTG TTTGGTCTGG CACAACAGGG TAATGCGCCA 
AAAGCGCTGG CGTCTGTCGA TAAACGTGGT GTACCAGTAA ATACCATTCT GGTGTCTGCA 
CTGGTAACGG CGTTGTGCGT ACTGATTAAC TACCTTGCCC CAGAGTCCGC TTTCGGACTG 
TTAATGGCGC TGGTGGTATC TGCACTGGTA ATCAACTGGG CGATGATTAG CCTGGCGCAT 
ATGAAATTCC GTCGCGCCAA GCAGGAACAA GGCGTGGTAA CTCACTTCCC TGCTCTGCTT 
TATCCGCTGG GTAACTGGAT CTGCCTGCTG TTTATGGCGG CGGTACTGGT GATTATGCTG 
ATGACCCCAG GAATGGCGAT TTCGGTATAC CTGATCCCGG TATGGCTGAT CGTGTTAGGT 
ATCGGCTATC TGTTTAAAGA GAAAACCGCC AAAGCCGTAA AAGCGCATTA A

Protein sequence

MEGQQHGEQL KRGLKNRHIQ LIALGGAIGT GLFLGSASVI QSAGPGIILG YAIAGFIAFL 
IMRQLGEMVV EEPVAGSFSH FAYKYWGSFA GFASGWNYWV LYVLVAMAEL TAVGKYIQFW 
YPEIPTWVSA AVFFVVINAI NLTNVKVFGE MEFWFAIIKV IAVVAMIIFG GWLLFSGNGG 
PQATVSNLWD QGGFLPHGFT GLVMMMAIIM FSFGGLELVG ITAAEADNPE QSIPKATNQV 
IYRILIFYIG SLAVLLSLMP WTRVTADTSP FVLIFHELGD TFVANALNIV VLTAALSVYN 
SCVYCNSRML FGLAQQGNAP KALASVDKRG VPVNTILVSA LVTALCVLIN YLAPESAFGL 
LMALVVSALV INWAMISLAH MKFRRAKQEQ GVVTHFPALL YPLGNWICLL FMAAVLVIML 
MTPGMAISVY LIPVWLIVLG IGYLFKEKTA KAVKAH