Gene Dshi_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2036
Symbol
ID	5713031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	2155779
End bp	2156762
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	69%
IMG OID	641267960
Product	zinc-containing alcohol dehydrogenase
Protein accession	YP_001533376
Protein GI	159044582
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.194095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0749622
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGC TCGTTTATAC CGGGGTGGCG CAGCTGGCCT TCCGCGATGT GCCGGAGCCG 
GTTCCGGCTG CGGGCGATCA CCTGATCCGC ATCGACAGTG TCGGGATCTG CGGCTCGGAC 
ATGCATGCCT ATCTCGGACA TGACGATCGC CGCCCTGCCC CGCTGATCCT CGGGCACGAG 
GGCGCGGGCG TGATAATCGG CGGCCCCCGC GACGGGGAGC GTGTGACGAT CAATCCGCTC 
GTGACCTGCG GCACCTGCCC GGCCTGCGTG TCGGGACGCG ACAACCTGTG TGCCACAAGG 
CAGATCATCT CGATGCCCCC GCGCGATGGG GCGTTCGCGC AATACGTCGC CATGCCGGCA 
CGCAACCTGG TGACCGTACC CGACGACGTC CCGCTGGAGA AAGCCGCCCT GGCCGAGCCC 
GTGGCGGTCA GCTGGCACGC GGTGCGTCTG GGGCTGGCAT CCATGGCCGA CGCGCGCCGC 
GACAGCGCCC TGGTGATCGG CGGCGGGGCC ATCGGCGTGG CCGCCGCGAT CAGCCTGCAA 
GCGCAGGGTG TGGCGGACGT GACCCTCGTG GAGCCGAACG CCATGCGCCG CGAGTACCTC 
GCTCGCGATG CAAACTACAC CATCGCGACG CCCGAGCAGG TCGCAGGCCG GGTTTTCGAC 
ATCACCGTGG ACGGGGTTGG CTATGATGCC ACCCGGGCGG CGGCTTCGGC GGCGACCCGT 
CCCGGCGGTC TGCTCTTGCA TATCGGGCTG GGGGGTGGGT CCGCGGGCCT CGACATTAGG 
CGGATCACCC TGCAGGAGAT CACCGTGATC GGCACCTATA CCTACACCGC GCAGGATTTT 
CGCGACACCT GTGCCGCGAT GTTTGACGGC CGCCTCGGCG GGCTCGACTG GACCGAAAGC 
CGTCCCCTTT CCGCGGGGGC AGACGCCTTC GCCGATATCC GCGCGGGCCG CGTGCCCGCA 
CCCAAGATCA TACTCAAGCC GTAA

Protein sequence

MKALVYTGVA QLAFRDVPEP VPAAGDHLIR IDSVGICGSD MHAYLGHDDR RPAPLILGHE 
GAGVIIGGPR DGERVTINPL VTCGTCPACV SGRDNLCATR QIISMPPRDG AFAQYVAMPA 
RNLVTVPDDV PLEKAALAEP VAVSWHAVRL GLASMADARR DSALVIGGGA IGVAAAISLQ 
AQGVADVTLV EPNAMRREYL ARDANYTIAT PEQVAGRVFD ITVDGVGYDA TRAAASAATR 
PGGLLLHIGL GGGSAGLDIR RITLQEITVI GTYTYTAQDF RDTCAAMFDG RLGGLDWTES 
RPLSAGADAF ADIRAGRVPA PKIILKP