Gene EcolC_1858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1858
Symbol
ID	6065152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2057855
End bp	2058898
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	46%
IMG OID	641601272
Product	alcohol dehydrogenase
Protein accession	YP_001724834
Protein GI	170019880
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.368595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000214432
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAATT CAAAAGCAAT ATTGCAGGTG CCGGGCACAA TGAAAATTAT TTCAGCAGAA 
ATACCAGTGC CTAAAGAAGA TGAAGTTTTG ATTAAAGTAG AATATGTCGG TATTTGTGGT 
TCAGATGTAC ATGGTTTTGA ATCAGGCCCG TTTATTCCGC CTAAAGACCC AAATCAAGAA 
ATTGGCCTGG GTCATGAATG CGCCGGGACG GTTGTGGCTG TGGGAAGCCG CGTGCGCAAA 
TTTAAACCGG GGGATCGGGT AAATATCGAA CCTGGCGTTC CTTGCGGTCA CTGTCGTTAC 
TGTCTGGAAG GCAAATATAA CATCTGCCCG GACGTTGATT TTATGGCGAC ACAACCCAAC 
TACCGCGGCG CATTAACGCA CTATCTGTGT CATCCGGAGA GCTTTACTTA CAAACTGCCA 
GACAATATGG ACACGATGGA AGGGGCGCTG GTGGAGCCTG CCGCAGTCGG GATGCATGCC 
GCGATGCTGG CAGATGTTAA ACCGGGTAAG AAGATAATTA TTCTGGGAGC AGGTTGTATT 
GGTTTGATGA CGTTGCAAGC GTGCAAATGC CTGGGAGCAA CGGAAATTGC CGTCGTTGAT 
GTGCTGGAAA AACGTCTGAT AATGGCGGAA CAACTTGGTG CGACAGTGGT TATTAACGGC 
GCAAAAGAAG ACACTATTGC ACGCTGTCAG CAATTTACCG AAGACATGGG CGCAGATATT 
GTTTTCGAAA CAGCGGGTTC TGCGGTCACC GTTAAACAGG CACCTTATCT GGTAATGCGC 
GGCGGTAAAA TTATGATTGT TGGTACTGTA CCGGGCGATT CGGCAATCAA TTTCCTCAAA 
ATCAATCGCG AAGTCACTAT CCAGACGGTA TTCCGCTATG CCAATCGTTA TCCGGTCACG 
ATTGAAGCTA TTTCTTCAGG GCGATTCGAT GTGAAATCGA TGGTGACGCA TATTTACGAT 
TATCGGGATG TACAACAGGC ATTTGAAGAG TCAGTTAACA ACAAACGCGA CATTATTAAA 
GGCGTTATTA AAATTAGCGA TTAA

Protein sequence

MKNSKAILQV PGTMKIISAE IPVPKEDEVL IKVEYVGICG SDVHGFESGP FIPPKDPNQE 
IGLGHECAGT VVAVGSRVRK FKPGDRVNIE PGVPCGHCRY CLEGKYNICP DVDFMATQPN 
YRGALTHYLC HPESFTYKLP DNMDTMEGAL VEPAAVGMHA AMLADVKPGK KIIILGAGCI 
GLMTLQACKC LGATEIAVVD VLEKRLIMAE QLGATVVING AKEDTIARCQ QFTEDMGADI 
VFETAGSAVT VKQAPYLVMR GGKIMIVGTV PGDSAINFLK INREVTIQTV FRYANRYPVT 
IEAISSGRFD VKSMVTHIYD YRDVQQAFEE SVNNKRDIIK GVIKISD