Gene EcDH1_0544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0544
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	577947
End bp	579191
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	53%
IMG OID
Product	aromatic amino acid transporter
Protein accession	ACX38232
Protein GI	260447810
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAC TAACCACCAC CCAAACGTCA CCGTCGCTGC TTGGCGGCGT GGTGATTATC 
GGCGGCACCA TTATTGGCGC AGGGATGTTT TCTCTGCCAG TGGTCATGTC CGGGGCGTGG 
TTTTTCTGGT CAATGGCGGC GCTGATCTTT ACCTGGTTCT GTATGCTGCA TTCCGGCTTG 
ATGATTCTGG AAGCTAACCT GAATTACAGA ATCGGTTCGA GTTTTGACAC CATCACCAAA 
GATTTGCTGG GCAAAGGCTG GAACGTGGTC AACGGCATTT CCATTGCCTT TGTGCTCTAT 
ATCCTGACCT ATGCCTATAT TTCTGCCAGT GGTTCGATTC TGCATCACAC CTTCGCAGAG 
ATGTCACTAA ACGTCCCGGC ACGGGCGGCG GGTTTTGGTT TTGCATTGCT GGTAGCGTTT 
GTGGTGTGGT TGAGCACTAA AGCCGTCAGT CGCATGACAG CGATTGTGCT GGGGGCGAAA 
GTCATTACCT TCTTCCTCAC CTTTGGTAGC CTGCTGGGGC ATGTGCAGCC TGCGACATTG 
TTCAACGTCG CCGAAAGCAA TGCGTCTTAT GCACCGTATC TGTTGATGAC CCTGCCGTTC 
TGTCTGGCAT CGTTTGGTTA TCACGGTAAC GTGCCAAGCC TGATGAAGTA TTACGGCAAA 
GATCCGAAAA CCATCGTGAA ATGTCTGGTG TACGGTACGC TGATGGCGCT GGCGCTGTAT 
ACCATCTGGT TGCTGGCGAC GATGGGTAAC ATCCCGCGTC CGGAGTTTAT CGGTATTGCA 
GAGAAGGGCG GTAATATTGA TGTGCTGGTA CAGGCGTTAA GCGGCGTACT GAACAGCCGT 
AGTCTGGATC TGCTGCTGGT CGTGTTCTCA AACTTTGCGG TAGCGAGTTC GTTCCTCGGC 
GTAACGCTGG GTTTGTTTGA CTATCTGGCA GATCTGTTTG GTTTCGACGA CTCGGCTGTG 
GGCCGCTTGA AAACGGCATT GCTGACCTTT GCCCCGCCAG TTGTGGGGGG GCTGTTGTTC 
CCGAACGGAT TCCTGTACGC CATTGGTTAT GCTGGTTTAG CGGCTACCAT CTGGGCGGCA 
ATTGTTCCGG CGCTGTTAGC CCGTGCATCG CGTAAACGCT TTGGCAGCCC GAAATTCCGC 
GTCTGGGGTG GCAAGCCGAT GATTGCGCTG GTTCTGGTGT TTGGCGTCGG CAACGCACTG 
GTGCATATTT TATCGAGCTT TAATTTACTG CCGGTGTATC AGTAA

Protein sequence

MATLTTTQTS PSLLGGVVII GGTIIGAGMF SLPVVMSGAW FFWSMAALIF TWFCMLHSGL 
MILEANLNYR IGSSFDTITK DLLGKGWNVV NGISIAFVLY ILTYAYISAS GSILHHTFAE 
MSLNVPARAA GFGFALLVAF VVWLSTKAVS RMTAIVLGAK VITFFLTFGS LLGHVQPATL 
FNVAESNASY APYLLMTLPF CLASFGYHGN VPSLMKYYGK DPKTIVKCLV YGTLMALALY 
TIWLLATMGN IPRPEFIGIA EKGGNIDVLV QALSGVLNSR SLDLLLVVFS NFAVASSFLG 
VTLGLFDYLA DLFGFDDSAV GRLKTALLTF APPVVGGLLF PNGFLYAIGY AGLAATIWAA 
IVPALLARAS RKRFGSPKFR VWGGKPMIAL VLVFGVGNAL VHILSSFNLL PVYQ