Gene EcolC_2210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2210
Symbol
ID	6065464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2431277
End bp	2432314
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	53%
IMG OID	641601616
Product	alcohol dehydrogenase
Protein accession	YP_001725175
Protein GI	170020221
COG category	[R] General function prediction only
COG ID	[COG2130] Putative NADP-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.904335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCAAC AAAAGCAGCG TAATCGACGT TGGGTTCTGG CCTCGCGTCC ACATGGCGCA 
CCGGTTCCGG AGAATTTCCG TCTTGAAGAA GATGATGTCG CCACACCGGG TGAAGGACAG 
GTGTTACTGC GCACAGTTTA TTTGTCCCTG GACCCGTATA TGCGTGGACG TATGAGCGAT 
GAGCCATCTT ATTCACCGCC TGTTGATATT GGCGGCGTGA TGGTCGGCGG CACGGTGAGC 
CGTGTTGTGG AGTCGAATCA TCCTGATTAT CAGCCTGGCG ACTGGGTGCT GGGCTACAGT 
GGATGGCAGG ACTATGACAT ATCCAGTGGT GATGATCTGG TGAAACTTGG CGATCATCCG 
CAAAATCCAT CGTGGTCGCT GGGTGTGCTG GGGATGCCAG GCTTTACCGC TTATATGGGG 
CTGCTGGATA TCGGTCAGCC TAAAGAGGGC GAAACGTTGG TGGTAGCTGC GGCGACAGGT 
CCTGTGGGAG CAACGGTGGG GCAAATCGGC AAACTTAAAG GTTGCAGGGT GGTGGGGGTT 
GCCGGTGGCG CGGAAAAATG CCGCCATGCT ATCGAGGTGC TGGGCTTCGA TGTTTGTCTT 
GATCACCACG CGGATGATTT TGCCGAACAA CTGGCGAAAG CGTGCCCAAA AGGTATTGAT 
ATCTATTATG AAAACGTGGG CGGTAAGGTA TTTGATGCAG TGCTACCATT ACTTAATACA 
TCTGCGCGCA TTCCCGTTTG TGGCTTAGTG AGCAGCTATA ACGCTACAGA GCTACCACCC 
GGTCCGGATC GTTTACCCCT GTTGATGGCA ACGGTGCTGA AAAAACGTAT TCGCTTGCAA 
GGGTTTATTA TCGCTCAGGA TTATGGTCAC CGCATCCATG AGTTTCAGAA GGAGATGGGG 
CAATGGGTGA AAGAGGATAA AATCCACTAC CGCGAAGATA TTACTGATGG TTTAGAGAAT 
GCGCCACAGA CGTTTATCGG CCTGCTGAAG GGTAAAAACT TCGGCAAAGT GGTGATCCGC 
GTGGCGGGTG ATGATTAA

Protein sequence

MGQQKQRNRR WVLASRPHGA PVPENFRLEE DDVATPGEGQ VLLRTVYLSL DPYMRGRMSD 
EPSYSPPVDI GGVMVGGTVS RVVESNHPDY QPGDWVLGYS GWQDYDISSG DDLVKLGDHP 
QNPSWSLGVL GMPGFTAYMG LLDIGQPKEG ETLVVAAATG PVGATVGQIG KLKGCRVVGV 
AGGAEKCRHA IEVLGFDVCL DHHADDFAEQ LAKACPKGID IYYENVGGKV FDAVLPLLNT 
SARIPVCGLV SSYNATELPP GPDRLPLLMA TVLKKRIRLQ GFIIAQDYGH RIHEFQKEMG 
QWVKEDKIHY REDITDGLEN APQTFIGLLK GKNFGKVVIR VAGDD