Gene EcDH1_4257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4257
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4621679
End bp	4622854
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX41855
Protein GI	260451433
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCGCT TTTTGATTTG TAGTTTTGCC CTGGTTTTAC TTTATCCCGC CGGGATTGAT 
ATGTACCTCG TTGGTTTACC GCGCATCGCC GCCGATCTCA ATGCCAGCGA AGCGCAGTTG 
CATATTGCGT TCTCCGTATA TCTGGCGGGG ATGGCAGCTG CGATGTTATT TGCCGGTAAA 
GTGGCCGATC GTTCAGGGAG AAAGCCGGTC GCCATACCCG GCGCGGCGCT ATTTATTATT 
GCCTCGGTGT TCTGTTCACT GGCTGAAACC AGCACGTTAT TTCTTGCAGG CCGATTTCTA 
CAGGGGTTGG GCGCAGGCTG TTGTTACGTA GTGGCGTTCG CTATTTTGCG CGACACGCTG 
GATGATCGAC GTCGGGCTAA AGTGCTGTCA TTACTCAACG GTATTACCTG CATCATTCCG 
GTGTTAGCGC CAGTGCTCGG ACATCTGATT ATGCTTAAAT TCCCGTGGCA GAGTCTGTTC 
TGGGCGATGG CAATGATGGG CATCGCGGTA CTGATGTTGT CTTTGTTTAT TTTAAAAGAA 
ACGCGCCCAG CGGCCCCCGC AGCTTCGGAT AAACCACGAG AAAATAGCGA GTCGCTGCTT 
AACCGTTTTT TCCTCAGCCG TGTTGTTATC ACCACCCTCA GCGTTTCGGT GATCCTCACT 
TTCGTCAACA CGTCACCGGT ATTGCTGATG GAAATCATGG GGTTTGAGCG CGGTGAATAC 
GCCACCATTA TGGCGCTGAC CGCTGGCGTC AGCATGACCG TTTCATTCTC CACGCCATTT 
GCGCTGGGAA TTTTTAAGCC ACGTACGTTG ATGATCACCT CGCAGGTGTT ATTCCTGGCG 
GCGGGGATCA CTCTTGCCGT TTCACCTTCC CATGCGGTTT CTCTGTTTGG TATCACGCTG 
ATTTGCGCCG GTTTCTCGGT AGGTTTTGGT GTGGCGATGA GTCAGGCGTT AGGGCCGTTT 
TCATTACGCG CGGGCGTAGC CAGCTCGACC TTAGGTATTG CGCAGGTTTG CGGTTCGTCA 
CTGTGGATTT GGCTGGCAGC GGTGGTTGGT ATCGGCGCAT GGAATATGCT GATCGGGATT 
CTGATTGCCT GTAGCATAGT GAGCCTGTTG CTGATTATGT TCGTCGCGCC TGGACGCCCC 
GTTGCCGCTC ATGAAGAAAT CCATCACCAC GCTTGA

Protein sequence

MSRFLICSFA LVLLYPAGID MYLVGLPRIA ADLNASEAQL HIAFSVYLAG MAAAMLFAGK 
VADRSGRKPV AIPGAALFII ASVFCSLAET STLFLAGRFL QGLGAGCCYV VAFAILRDTL 
DDRRRAKVLS LLNGITCIIP VLAPVLGHLI MLKFPWQSLF WAMAMMGIAV LMLSLFILKE 
TRPAAPAASD KPRENSESLL NRFFLSRVVI TTLSVSVILT FVNTSPVLLM EIMGFERGEY 
ATIMALTAGV SMTVSFSTPF ALGIFKPRTL MITSQVLFLA AGITLAVSPS HAVSLFGITL 
ICAGFSVGFG VAMSQALGPF SLRAGVASST LGIAQVCGSS LWIWLAAVVG IGAWNMLIGI 
LIACSIVSLL LIMFVAPGRP VAAHEEIHHH A