Gene Rsph17029_0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0472
Symbol
ID	4895587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	492993
End bp	494117
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	73%
IMG OID	640111056
Product	alcohol dehydrogenase
Protein accession	YP_001042360
Protein GI	126461246
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA CGGCGGCGGT GCTCGAACGC GACGGGATCG CGGGGAATTA TGCCGAGGAG 
CGGCCGCTCG CGATCCGCGA GCTCGATCTC GCGGAGCCGG GGCCGGGCGA GGTCCTGATC 
CGGGTGGCCG CCGCGGGCAT CTGCCATTCC GACCTGTCGG TCATCAACGG CACGCGGCGG 
CGGCCGCTGC CGATGGTGCT CGGCCACGAG GCCTCGGGCC ATGTCGAGGC TCTGGGCGAG 
GGGGTCGAGG ATCTTGAGCC CGGCGACCAT GTCGTCTGCA TCTTCGCACC CGGCTGCGGC 
CGCTGCACGC CCTGCGCCGA GGGGCGGCCT GCGCTCTGCG AGAAGGCGGC GCGCCATCAT 
GCGGTGGGCG AACTGATGAC CGGGCACCGG CGGCTGTCGC TCGGCGGGCG GTCCGTGCAC 
CATCACCTCG GCATCTCGGG CTTTGCCACC CATGCCGTGG TGGCGCGGCC GTCGCTGGTC 
CGCGTCCCGC GCGAGGTCCC GCCCCATGTC TCGGCGCTTT TCTCCTGCGC CATGCTGACG 
GGGGCGGGGG CCGTCTTCAA CACGGCGCAG ATCCGGCCCG GCTCGAAGGT CGCCGTGGTG 
GGGCTGGGCG GCGTCGGCCT GTCCGCCATC CTCGGCGCGG CGGCGGCCGG AGCGGCCGAG 
ATCGTGGCGA TCGACCCGTT TCCCGCCAAG ATGGAGGCCG CGCGCGCCAT GGGCGCGACG 
CTCTCGGTGC CCGCGGACGG AGATACGGTG GCGGCGGTGC GCGACCTGAC GGCGGGCGGC 
GTCGATTACG CCTTCGAGCT GGCGGGCTCG GTCCGGGCGC TCGAAACCGC CTTCGCCGTC 
ACCCGCCGCG GCGGCATGAC GGTGACCGCG GGCCTGCCCC ACCCGGACGA CCGGATGTCG 
CTCGAGGCAC TGAAGCTCGT GGCCGAGGAG CGCACCCTGA AAGGCAGCTA CATCGGATCC 
TGCGTGCCCC AGCGCGACCT GCCGCGGATG CTGGCGCTGC ACCGCCGCGG CCTGCTGCCG 
GTCGAGAAGA TGCTGACCCA CCGGCTGAAG CTCGACGAGA TCAACCTCGC GATGGACCGG 
CTGGCCGAGG GCAGCGCGAT CCGGCAGGTG GTGGATCTCG GCTGA

Protein sequence

MKITAAVLER DGIAGNYAEE RPLAIRELDL AEPGPGEVLI RVAAAGICHS DLSVINGTRR 
RPLPMVLGHE ASGHVEALGE GVEDLEPGDH VVCIFAPGCG RCTPCAEGRP ALCEKAARHH 
AVGELMTGHR RLSLGGRSVH HHLGISGFAT HAVVARPSLV RVPREVPPHV SALFSCAMLT 
GAGAVFNTAQ IRPGSKVAVV GLGGVGLSAI LGAAAAGAAE IVAIDPFPAK MEAARAMGAT 
LSVPADGDTV AAVRDLTAGG VDYAFELAGS VRALETAFAV TRRGGMTVTA GLPHPDDRMS 
LEALKLVAEE RTLKGSYIGS CVPQRDLPRM LALHRRGLLP VEKMLTHRLK LDEINLAMDR 
LAEGSAIRQV VDLG