Gene EcHS_A0116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0116
Symbol	aroP
ID	5592525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	121817
End bp	123187
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	53%
IMG OID	640919303
Product	aromatic amino acid transporter
Protein accession	YP_001456898
Protein GI	157159580
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0000572779
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGGTC AACAGCACGG CGAGCAGCTA AAGCGCGGCC TTAAAAACCG CCATATTCAG 
CTTATCGCGC TGGGTGGCGC GATAGGGACC GGGTTATTCC TGGGTAGCGC CTCCGTAATA 
CAGTCCGCAG GGCCAGGGAT TATCCTGGGT TACGCCATTG CTGGTTTTAT CGCCTTTCTG 
ATCATGCGTC AGCTGGGTGA AATGGTGGTC GAAGAACCTG TCGCAGGCTC CTTTAGCCAC 
TTTGCTTATA AATACTGGGG CAGTTTTGCC GGTTTCGCCT CTGGCTGGAA CTACTGGGTA 
CTGTACGTTT TAGTTGCCAT GGCTGAGCTG ACTGCCGTGG GTAAATACAT TCAGTTCTGG 
TATCCGGAAA TCCCCACCTG GGTTTCTGCC GCCGTATTCT TTGTGGTGAT TAACGCCATC 
AACCTGACCA ACGTTAAAGT GTTTGGCGAG ATGGAGTTCT GGTTTGCCAT TATCAAAGTT 
ATCGCGGTGG TAGCGATGAT CATCTTCGGC GGCTGGCTGC TATTCAGTGG CAACGGCGGC 
CCGCAGGCGA CCGTTAGCAA CCTGTGGGAT CAGGGTGGTT TCCTGCCGCA CGGCTTCACC 
GGGCTGGTGA TGATGATGGC GATTATCATG TTCTCGTTCG GTGGTCTGGA ACTGGTGGGG 
ATCACCGCAG CAGAAGCTGA TAACCCGGAG CAAAGTATAC CGAAAGCAAC TAACCAGGTT 
ATCTACCGCA TCCTGATTTT CTATATTGGT TCGTTAGCCG TTCTGCTCTC ACTGATGCCG 
TGGACCCGCG TTACCGCCGA TACCAGTCCG TTTGTGCTGA TCTTCCACGA GTTAGGCGAT 
ACCTTTGTGG CGAATGCGCT GAACATCGTG GTACTGACTG CGGCGCTCTC CGTGTACAAC 
AGCTGCGTAT ATTGCAACAG CCGTATGCTG TTTGGTCTGG CACAACAGGG TAATGCGCCA 
AAAGCGCTGG CGTCTGTCGA TAAACGTGGT GTACCAGTAA ATACCATTCT GGTGTCTGCA 
CTGGTAACGG CGTTGTGCGT ACTGATTAAC TACCTTGCCC CAGAGTCCGC TTTCGGACTG 
TTAATGGCGC TGGTGGTATC TGCACTGGTA ATCAACTGGG CGATGATTAG CCTGGCGCAT 
ATGAAATTCC GTCGCGCCAA GCAGGAACAA GGCGTGGTAA CTCGCTTCCC TGCTCTGCTT 
TATCCGCTGG GTAACTGGAT CTGCCTGCTG TTTATGGCGG CGGTACTGGT GATTATGCTG 
ATGACCCCAG GAATGGCGAT TTCGGTATAC CTGATCCCGG TATGGCTGAT CGTGTTAGGT 
ATCGGCTATC TGTTTAAAGA GAAAACCGCC AAAGCCGTAA AAGCGCATTA A

Protein sequence

MEGQQHGEQL KRGLKNRHIQ LIALGGAIGT GLFLGSASVI QSAGPGIILG YAIAGFIAFL 
IMRQLGEMVV EEPVAGSFSH FAYKYWGSFA GFASGWNYWV LYVLVAMAEL TAVGKYIQFW 
YPEIPTWVSA AVFFVVINAI NLTNVKVFGE MEFWFAIIKV IAVVAMIIFG GWLLFSGNGG 
PQATVSNLWD QGGFLPHGFT GLVMMMAIIM FSFGGLELVG ITAAEADNPE QSIPKATNQV 
IYRILIFYIG SLAVLLSLMP WTRVTADTSP FVLIFHELGD TFVANALNIV VLTAALSVYN 
SCVYCNSRML FGLAQQGNAP KALASVDKRG VPVNTILVSA LVTALCVLIN YLAPESAFGL 
LMALVVSALV INWAMISLAH MKFRRAKQEQ GVVTRFPALL YPLGNWICLL FMAAVLVIML 
MTPGMAISVY LIPVWLIVLG IGYLFKEKTA KAVKAH