Gene EcDH1_3213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3213
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3458390
End bp	3459658
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	51%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX40839
Protein GI	260450417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCTTGC TGGTCGTTAT CCTGCAAGCT ATCACTTTAT TGGCTACGGT GATTGGTAGC 
CGTTCTGGTG GTTGTGATGG TGGTATGAAA AAAGTCATTT TATCTTTGGC TCTGGGCACG 
TTTGGTTTGG GGATGGCCGA ATTTGGCATT ATGGGCGTGC TCACGGAGCT GGCGCATAAC 
GTAGGAATTT CGATTCCTGC CGCCGGGCAT ATGATCTCGT ATTATGCACT GGGGGTGGTG 
GTCGGTGCGC CAATCATCGC ACTCTTTTCC AGCCGCTACT CACTCAAACA TATCTTGTTG 
TTTCTGGTGG CGTTGTGCGT CATTGGCAAC GCCATGTTCA CGCTCTCTTC GTCTTACCTG 
ATGCTCGCCA TTGGTCGGCT GGTATCCGGC TTTCCGCATG GCGCATTTTT TGGCGTCGGA 
GCGATCGTGT TATCAAAAAT TATCAAACCC GGAAAAGTCA CCGCCGCCGT GGCGGGGATG 
GTTTCCGGGA TGACAGTCGC CAATTTGCTG GGCATTCCGC TGGGAACGTA TTTAAGTCAG 
GAATTTAGCT GGCGTTACAC CTTTTTATTG ATCGCTGTTT TTAATATTGC GGTGATGGCA 
TCGGTCTATT TTTGGGTGCC AGATATTCGC GACGAGGCGA AAGGAAATCT GCGCGAACAA 
TTTCACTTTT TGCGCAGCCC GGCCCCGTGG TTAATTTTCG CCGCCACGAT GTTTGGCAAC 
GCAGGTGTGT TTGCCTGGTT CAGCTACGTA AAGCCATACA TGATGTTTAT TTCCGGTTTT 
TCGGAAACGG CGATGACCTT TATTATGATG TTAGTTGGGC TAGGGATGGT GCTGGGAAAT 
ATGCTAAGTG GCAGGATTTC AGGACGTTAT TCACCACTGC GCATTGCAGC AGTGACTGAC 
TTTATAATTG TACTGGCACT GCTGATGCTC TTTTTCTGCG GCGGCATGAA AACAACGTCG 
CTTATTTTTG CTTTTATTTG TTGCGCGGGA TTATTTGCCC TTTCAGCACC GCTACAAATA 
TTGTTACTAC AAAACGCCAA AGGCGGAGAG TTATTAGGTG CCGCAGGTGG GCAAATAGCG 
TTTAACCTCG GTAGCGCCGT CGGCGCATAT TGCGGAGGTA TGATGCTGAC GCTGGGGCTG 
GCATATAATT ACGTGGCGCT GCCTGCCGCC CTGCTTTCGT TTGCTGCGAT GTCGTCGTTG 
CTGCTGTATG GTCGCTATAA GCGCCAGCAA GCGGCGGATA CTCCGGTGCT GGCGAAACCA 
CTGGGGTAG

Protein sequence

MALLVVILQA ITLLATVIGS RSGGCDGGMK KVILSLALGT FGLGMAEFGI MGVLTELAHN 
VGISIPAAGH MISYYALGVV VGAPIIALFS SRYSLKHILL FLVALCVIGN AMFTLSSSYL 
MLAIGRLVSG FPHGAFFGVG AIVLSKIIKP GKVTAAVAGM VSGMTVANLL GIPLGTYLSQ 
EFSWRYTFLL IAVFNIAVMA SVYFWVPDIR DEAKGNLREQ FHFLRSPAPW LIFAATMFGN 
AGVFAWFSYV KPYMMFISGF SETAMTFIMM LVGLGMVLGN MLSGRISGRY SPLRIAAVTD 
FIIVLALLML FFCGGMKTTS LIFAFICCAG LFALSAPLQI LLLQNAKGGE LLGAAGGQIA 
FNLGSAVGAY CGGMMLTLGL AYNYVALPAA LLSFAAMSSL LLYGRYKRQQ AADTPVLAKP 
LG