Gene EcDH1_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4037
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4370861
End bp	4371940
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	54%
IMG OID
Product	PTS system, fructose subfamily, IIC subunit
Protein accession	ACX41637
Protein GI	260451215
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAGT TGGTGCAGAT CCTGAAAAAT ACCCGTCAGC ATTTAATGAC GGGCGTTTCA 
CACATGATTC CCTTCGTGGT ATCGGGCGGT ATTTTGCTGG CGGTTTCCGT CATGTTGTAT 
GGCAAAGGCG CAGTGCCGGA TGCCGTAGCC GATCCAAATC TGAAAAAACT GTTTGATATC 
GGCGTTGCGG GCTTGACGCT GATGGTGCCT TTCCTCGCAG CGTACATCGG TTATTCCATT 
GCAGAGCGTT CTGCGCTGGC TCCGTGCGCT ATCGGTGCCT GGGTTGGTAA CAGCTTTGGT 
GCGGGCTTCT TTGGTGCACT GATCGCCGGG ATTATCGGCG GCATCGTGGT GCATTACCTG 
AAGAAAATTC CGGTGCATAA AGTTCTGCGC TCGGTGATGC CTATCTTCAT TATTCCTATC 
GTCGGCACAC TGATTACCGC AGGCATCATG ATGTGGGGCT TGGGCGAGCC TGTAGGGGCG 
TTGACCAACA GCCTGACTCA GTGGCTTCAG GGGATGCAGC AGGGCAGCAT TGTTATGCTG 
GCGGTGATCA TGGGTCTGAT GCTGGCGTTC GATATGGGCG GTCCGGTTAA CAAAGTGGCC 
TATGCCTTCA TGCTGATTTG CGTTGCTCAG GGTGTTTATA CCGTGGTGGC CATCGCTGCC 
GTGGGTATTT GTATCCCGCC GCTGGGGATG GGGCTGGCGA CGCTGATTGG TCGTAAAAAT 
TTCTCCGCAG AAGAGCGCGA AACCGGCAAA GCGGCACTGG TGATGGGCTG TGTTGGCGTT 
ACTGAAGGGG CGATTCCTTT CGCCGCTGCC GATCCGCTGC GTGTCATTCC TTCCATCATG 
GTCGGTTCAG TTTGTGGTGC AGTAACTGCG GCGCTGGTCG GTGCGCAGTG CTATGCAGGC 
TGGGGTGGTC TGATTGTGCT GCCGGTGGTT GAAGGCAAGC TGGGTTATAT CGCAGCAGTG 
GCTGTCGGAG CAGTGGTGAC GGCTGTTTGT GTGAACGTGC TGAAAAGTCT GGCGCGTAAA 
AATGGGTCTT CGACTGATGA AAAAGAAGAC GACCTGGATT TGGATTTTGA AATTAATTAA

Protein sequence

MNELVQILKN TRQHLMTGVS HMIPFVVSGG ILLAVSVMLY GKGAVPDAVA DPNLKKLFDI 
GVAGLTLMVP FLAAYIGYSI AERSALAPCA IGAWVGNSFG AGFFGALIAG IIGGIVVHYL 
KKIPVHKVLR SVMPIFIIPI VGTLITAGIM MWGLGEPVGA LTNSLTQWLQ GMQQGSIVML 
AVIMGLMLAF DMGGPVNKVA YAFMLICVAQ GVYTVVAIAA VGICIPPLGM GLATLIGRKN 
FSAEERETGK AALVMGCVGV TEGAIPFAAA DPLRVIPSIM VGSVCGAVTA ALVGAQCYAG 
WGGLIVLPVV EGKLGYIAAV AVGAVVTAVC VNVLKSLARK NGSSTDEKED DLDLDFEIN