Gene Rsph17029_3833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3833
Symbol
ID	4898267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	962411
End bp	963595
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	67%
IMG OID	640114437
Product	alcohol dehydrogenase
Protein accession	YP_001045685
Protein GI	126464572
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.24597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.375314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCAC TCACCTGGCA CGGAAAGCAC GATGTCCGCG TCGAGACCCA TCCCGATCCC 
GAGATCGTCA ATCCGCGCGA CGCGATCATC GAGGTGACGG CCACGGCGAT CTGCGGCTCG 
GATCTGCATC TCTACGACGG GGTGATCCCG GGGCTGATGT CGGGCGACAT CCTCGGCCAC 
GAGTTCATGG GCCGCGTCGT CGAGACCGGG CCGAAAAGCA CGCTGAAGAA GGGCCAGCGG 
GTCGTGGTGC CCTTCACGAT CTCCTGCGGG AAGTGCTTCT TCTGCGAGCA TCAGCTCTTT 
TCCGCCTGCG ACAATTCCAA CCCCGCGGAG AAGCAGGACC TGTCCGAGCC TCTCTATGGC 
CATGCGGTGT CGGGGCTCTT CGGCTATTCC CATCTGACGG GCGGCTATCC GGGCGGGCAG 
GCCGAATATG TGCGCGTGCC CTATTCGGAC GTGGGACCGA TCGTGATCCC GGACGGGCTC 
GAGGACGAGC AGGTGCTGTT CCTGTCGGAC ATCCTGCCGA CGGGCTGGAT GGCCGCCGAG 
AATGCCGGGA TCGAGGAGGG CGACACGGTC GCCGTCTGGG GCTGCGGCCC GGTCGGCCTC 
TTCGCGATCC AGTCGGCCCT GCTGATGGGG GCGGGCAAGG TCATCGCCAT CGACGAATAT 
CCCAAGCGGC TGGCGCTGGC GCGCAGGCTC GGGGCGGAAG TGATCGACTT CCGGCGCACG 
AAGGTGCTCG AGGCGCTGAT GGAGATGTCG GGGGGCCTCG GCCCCGATGC GGTGATCGAT 
GCCGTGGGGA TGGAGGCGCA TGGCTTCATG CCCGACACGC TGATGGACAA CATGAAGCAG 
CGCGTGGGGA TCGGCGCGGA CAGCGGGCAC GCGCTGCGCG AGGCGATCCT CGCGGTGCGC 
AAGGGCGGCC GCGTCTCGGT GCCCGGCGTC TATGGCGGCT TCCTCGACAA GTTTCCGCTC 
GGCGCGCTGA TGGAGAAGGG CCTGACCGTG AAGACCGGCC AGACCCATGT GCAGCGATAC 
ACCGAGGAGC TTCTGCGCCG GATCGGCGAC GGCGAGATCG ACACGACCTT CCTGATCTCG 
CACCGCCTGC CGCTCGAGGA GGCGGCGCGG GGCTACGAGA ACTTCCGCTT CAACCAGAAC 
GAATGGACCA AGGTGGTGCT GAAGCCGGGC CTGACCGGCG CCTGA

Protein sequence

MRALTWHGKH DVRVETHPDP EIVNPRDAII EVTATAICGS DLHLYDGVIP GLMSGDILGH 
EFMGRVVETG PKSTLKKGQR VVVPFTISCG KCFFCEHQLF SACDNSNPAE KQDLSEPLYG 
HAVSGLFGYS HLTGGYPGGQ AEYVRVPYSD VGPIVIPDGL EDEQVLFLSD ILPTGWMAAE 
NAGIEEGDTV AVWGCGPVGL FAIQSALLMG AGKVIAIDEY PKRLALARRL GAEVIDFRRT 
KVLEALMEMS GGLGPDAVID AVGMEAHGFM PDTLMDNMKQ RVGIGADSGH ALREAILAVR 
KGGRVSVPGV YGGFLDKFPL GALMEKGLTV KTGQTHVQRY TEELLRRIGD GEIDTTFLIS 
HRLPLEEAAR GYENFRFNQN EWTKVVLKPG LTGA