Gene EcDH1_4189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4189
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4541948
End bp	4543210
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	54%
IMG OID
Product	nucleotide sugar dehydrogenase
Protein accession	ACX41789
Protein GI	260451367
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTTG CGACCATTTC TGTTATCGGA CTGGGTTATA TCGGGCTGCC AACGGCAGCA 
GCGTTTGCCT CACGGCAAAA ACAGGTAATT GGTGTCGATA TCAACCAACA TGCGGTTGAT 
ACCATCAATC GTGGCGAAAT CCATATCGTC GAACCTGATT TGGCGAGTGT AGTAAAAACT 
GCCGTAGAAG GCGGTTTTTT ACGAGCGAGC ACGACGCCAG TTGAAGCGGA TGCCTGGCTG 
ATTGCTGTAC CCACGCCGTT TAAGGGCGAT CATGAGCCAG ATATGACCTA CGTTGAATCG 
GCTGCTCGCT CCATTGCGCC AGTGCTGAAA AAAGGCGCGC TGGTGATCCT TGAATCCACC 
TCGCCGGTGG GGTCAACCGA GAAGATGGCA GAATGGTTAG CAGAGATGCG TCCGGATCTC 
ACTTTCCCGC AGCAGGTGGG CGAGCAGGCG GACGTCAACA TTGCTTACTG CCCGGAACGC 
GTGTTACCAG GACAGGTAAT GGTCGAGCTG ATTAAAAACG ATCGCGTGAT TGGTGGTATG 
ACGCCGGTTT GTTCGGCCCG CGCCAGCGAA CTGTACAAAA TTTTCCTCGA AGGTGAGTGT 
GTCGTCACTA ACTCGCGGAC GGCGGAAATG TGTAAGCTCA CCGAAAACAG CTTCCGCGAT 
GTGAATATCG CTTTTGCTAA TGAATTGTCG CTGATTTGTG CCGATCAGGG GATTAACGTC 
TGGGAACTGA TTCGCCTGGC GAATCGTCAC CCTCGCGTTA ATATTCTTCA GCCTGGCCCT 
GGCGTGGGCG GTCACTGCAT TGCTGTTGAT CCGTGGTTTA TCGTGGCACA GAACCCCCAG 
CAGGCGCGGC TTATCCGTAC CGCGCGCGAA GTGAACGATC ACAAACCGTT CTGGGTTATC 
GATCAGGTGA AAGCGGCGGT GGCTGATTGC CTGGCGGCTA CCGATAAACG CGCCAGTGAA 
CTGAAAATCG CCTGCTTTGG TCTGGCGTTT AAACCGAATA TTGATGACCT GCGCGAAAGC 
CCGGCGATGG AAATCGCTGA ACTGATCGCC CAGTGGCATA GCGGCGAAAC TCTGGTTGTT 
GAGCCTAACA TCCACCAGTT GCCGAAAAAA CTGACCGGGC TTTGTACTCT GGCGCAGCTT 
GACGAGGCGC TGGCAACGGC AGACGTGCTG GTGATGCTGG TCGATCATAG TCAGTTCAAA 
GTTATCAATG GCGACAATGT CCATCAGCAG TATGTCGTCG ATGCCAAAGG AGTCTGGCGC 
TGA

Protein sequence

MSFATISVIG LGYIGLPTAA AFASRQKQVI GVDINQHAVD TINRGEIHIV EPDLASVVKT 
AVEGGFLRAS TTPVEADAWL IAVPTPFKGD HEPDMTYVES AARSIAPVLK KGALVILEST 
SPVGSTEKMA EWLAEMRPDL TFPQQVGEQA DVNIAYCPER VLPGQVMVEL IKNDRVIGGM 
TPVCSARASE LYKIFLEGEC VVTNSRTAEM CKLTENSFRD VNIAFANELS LICADQGINV 
WELIRLANRH PRVNILQPGP GVGGHCIAVD PWFIVAQNPQ QARLIRTARE VNDHKPFWVI 
DQVKAAVADC LAATDKRASE LKIACFGLAF KPNIDDLRES PAMEIAELIA QWHSGETLVV 
EPNIHQLPKK LTGLCTLAQL DEALATADVL VMLVDHSQFK VINGDNVHQQ YVVDAKGVWR