Gene EcDH1_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0041
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	41975
End bp	43213
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	53%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX37739
Protein GI	260447317
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	85
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAGT GGTCGGCTTT TCCCCTGAAA CATGCCACGG GTAACACCAT GAGTGAATTT 
ATTGCCGAAA ACCGCGGCGC GGATGCCATC ACCCGACCGA ACTGGTCAGC CGTTTTCTCG 
GTGGCGTTTT GTGTCGCCTG TCTGATTATC GTTGAGTTTT TGCCCGTCAG TTTGTTGACG 
CCAATGGCCC AGGATTTAGG CATTTCGGAA GGGGTTGCCG GGCAATCGGT GACCGTGACC 
GCCTTTGTGG CAATGTTTGC CAGTTTGTTT ATTACCCAGA CAATTCAGGC TACTGACCGC 
CGCTACGTTG TTATTTTGTT TGCCGTTTTG CTGACGCTCT CCTGCTTGCT GGTTTCCTTT 
GCTAACTCAT TCAGTTTGCT TTTAATCGGT CGTGCCTGTC TGGGGCTGGC GCTGGGCGGG 
TTCTGGGCGA TGTCGGCGTC GCTGACCATG CGTCTGGTGC CGCCGCGTAC GGTGCCGAAG 
GCGCTGTCGG TGATCTTCGG CGCGGTTTCT ATTGCGCTGG TGATTGCCGC GCCGTTGGGC 
AGTTTTTTAG GCGAGCTTAT CGGTTGGCGC AATGTCTTTA ATGCGGCGGC GGTGATGGGC 
GTGCTGTGTA TTTTCTGGAT TATCAAATCA TTGCCTTCAC TGCCAGGCGA ACCCTCGCAT 
CAGAAACAAA ATACTTTCCG CTTATTACAA CGTCCGGGTG TGATGGCAGG GATGATCGCC 
ATCTTCATGT CTTTCGCCGG GCAGTTTGCT TTCTTCACGT ATATTCGCCC GGTGTATATG 
AACCTGGCGG GATTCGGCGT GGATGGCTTA ACGCTGGTGC TGTTGAGTTT TGGTATCGCC 
AGCTTTATTG GTACGTCGCT TTCGTCGTTC ATTCTTAAAC GTTCGGTAAA ACTGGCCTTA 
GCAGGCGCGC CGTTAATACT GGCTGTGAGT GCGTTGGTAC TGACGTTGTG GGGAAGCGAT 
AAAATCGTTG CTACCGGCGT GGCGATTATC TGGGGGCTAA CTTTTGCATT GGTTCCCGTC 
GGCTGGTCAA CGTGGATCAC CCGCTCGCTG GCCGATCAGG CAGAAAAAGC CGGGTCTATT 
CAGGTGGCGG TTATTCAGCT TGCTAATACC TGTGGCGCGG CAATCGGCGG TTATGCGCTG 
GATAATATTG GTCTGACTTC GCCGTTGATG TTGTCCGGCA CATTGATGTT GCTGACTGCA 
TTGTTGGTTA CTGCAAAGGT GAAAATGAAG AAATCCTGA

Protein sequence

MLKWSAFPLK HATGNTMSEF IAENRGADAI TRPNWSAVFS VAFCVACLII VEFLPVSLLT 
PMAQDLGISE GVAGQSVTVT AFVAMFASLF ITQTIQATDR RYVVILFAVL LTLSCLLVSF 
ANSFSLLLIG RACLGLALGG FWAMSASLTM RLVPPRTVPK ALSVIFGAVS IALVIAAPLG 
SFLGELIGWR NVFNAAAVMG VLCIFWIIKS LPSLPGEPSH QKQNTFRLLQ RPGVMAGMIA 
IFMSFAGQFA FFTYIRPVYM NLAGFGVDGL TLVLLSFGIA SFIGTSLSSF ILKRSVKLAL 
AGAPLILAVS ALVLTLWGSD KIVATGVAII WGLTFALVPV GWSTWITRSL ADQAEKAGSI 
QVAVIQLANT CGAAIGGYAL DNIGLTSPLM LSGTLMLLTA LLVTAKVKMK KS