Gene EcDH1_2102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2102
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2246193
End bp	2247476
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	47%
IMG OID
Product	metabolite/H+ symporter, major facilitator superfamily (MFS)
Protein accession	ACX39757
Protein GI	260449335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000000000410847
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTCC AGTTATATTC GCTCGGCGCA GCGTTAGTGT TTCATGAAAT ATTTTTTCCT 
GAATCATCAA CGGCAATGGC GTTAATTCTG GCAATGGGAA CCTACGGTGC AGGTTATGTG 
GCGCGTATTG TCGGAGCATT TATTTTCGGC AAAATGGGCG ACAGAATAGG GCGTAAAAAA 
GTGCTCTTTA TTACCATCAC CATGATGGGG ATCTGTACCA CCTTAATTGG TGTGTTACCG 
ACCTATGCAC AGATTGGTGT TTTTGCACCC ATCTTGCTGG TGACGTTGCG TATTATTCAG 
GGGTTGGGTG CAGGTGCGGA AATTTCCGGT GCCGGTACGA TGCTGGCGGA ATATGCGCCA 
AAAGGTAAGC GCGGAATTAT CTCCTCATTT GTGGCTATGG GAACTAACTG CGGAACCTTG 
AGCGCAACGG CAATCTGGGC CTTTATGTTC TTCATTCTCA GTAAAGAGGA ACTGCTGGCG 
TGGGGATGGC GTATACCGTT CCTGGCGAGT GTTGTCGTGA TGGTCTTTGC TATCTGGTTG 
CGTATGAATC TGAAAGAAAG CCCGGTCTTT GAGAAGGTTA ACGACAGTAA CCAACCGACA 
GCAAAACCTG CACCTGCTGG TAGCATGTTC CAGAGCAAAT CCTTCTGGCT GGCAACAGGG 
CTGCGTTTTG GTCAGGCGGG TAACTCCGGG TTAATTCAGA CTTTCCTTGC AGGCTATTTA 
GTGCAGACGT TATTGTTTAA CAAAGCAATT CCAACAGATG CATTGATGAT CAGTTCGATT 
CTCGGCTTTA TGACCATTCC GTTCCTTGGT TGGTTATCCG ATAAAATTGG TCGCCGGATC 
CCGTATATTA TTATGAATAC CTCCGCGATT GTGCTGGCAT GGCCAATGCT TTCTATCATT 
GTAGATAAAA GCTATGCCCC GAGCACCATT ATGGTTGCAC TGATTGTGAT TCATAACTGT 
GCGGTGCTGG GATTATTTGC TCTGGAAAAC ATTACCATGG CAGAAATGTT CGGCTGTAAA 
AACCGCTTTA CCCGGATGGC TATTTCTAAA GAAATTGGTG GTCTTATCGC TTCCGGTTTT 
GGTCCTATCC TGGCGGGTAT TTTCTGCACC ATGACGGAAT CCTGGTATCC GATCGCCATT 
ATGATCATGG CATATTCAGT GATTGGTTTA ATCTCTGCGC TGAAAATGCC AGAGGTGAAA 
GACCGTGATT TAAGTGCGCT GGAAGACGCT GCGGAAGATC AACCGCGTGT TGTAAGAGCT 
GCGCAACCTT CCAGAAGTCT GTAA

Protein sequence

MDFQLYSLGA ALVFHEIFFP ESSTAMALIL AMGTYGAGYV ARIVGAFIFG KMGDRIGRKK 
VLFITITMMG ICTTLIGVLP TYAQIGVFAP ILLVTLRIIQ GLGAGAEISG AGTMLAEYAP 
KGKRGIISSF VAMGTNCGTL SATAIWAFMF FILSKEELLA WGWRIPFLAS VVVMVFAIWL 
RMNLKESPVF EKVNDSNQPT AKPAPAGSMF QSKSFWLATG LRFGQAGNSG LIQTFLAGYL 
VQTLLFNKAI PTDALMISSI LGFMTIPFLG WLSDKIGRRI PYIIMNTSAI VLAWPMLSII 
VDKSYAPSTI MVALIVIHNC AVLGLFALEN ITMAEMFGCK NRFTRMAISK EIGGLIASGF 
GPILAGIFCT MTESWYPIAI MIMAYSVIGL ISALKMPEVK DRDLSALEDA AEDQPRVVRA 
AQPSRSL