Gene Rsph17029_3057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3057
Symbol
ID	4899069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	68255
End bp	69376
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	72%
IMG OID	640113659
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001044929
Protein GI	126463816
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0713063
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGACG ACCTCACCCG ACCGATTACC CTTCTTCGGC CTGCCGCCGT GCATTTCGGC 
GAAGGCAGCC TTGCCCGCCT GCCAGAGTGG GTGGCCGCGC GCGGCTTTCG CGCGCCCTTC 
GTCATCGCCG ATGCGGTGAA TGCGCAGCGG CTGGACCGGC TGGGGCTCGG ATCGGTCGGC 
TGCTTCGGGA CCGTCGTGCC CGAGCCCGAC ACCGCCAATC TGCAGGCCGC CGTGGCCGCG 
GCCGAAGGGG CCGACCTGAT CGTGGGATTC GGCGGCGGCT CGGCCATGGA CCTGGCCAAG 
CTCGTGGCTG TGCTCGTGGG AACCGGCCTC GCGCTTTCGG ACATCTCCGG TCCCGGACGG 
GCGCCGGCCC GGCGCGTGGG CCTCGTGCAG GTGCCGACCA CCGCCGGGAC CGGCTCGGAA 
GTGGGCACGC GCGCCCTCGT GACGGATCCC GCGAGCCTTG CCAAGATCGC GACCGAAAGC 
GCCGAGATGC TTGCCGACAT GGCGATCGTG GACCCTGCGC TCACGCTCAG CGTGCCGCCC 
GCGGTCACGG CCGCAACCGG GGTCGACGCC ATGGCCCATT GCGCCGAGGC CCTGACCTCG 
AAACGGGCGC ATCCGCTGGT CGACGCCTAT GCTCTGGAGG GGATCGCGCT CGTCGGCCGC 
TTCCTGCGTC GCGCGGTCGA GGACGGGCAG GATGTCGAAG CCCGGGCAGG CCTGTCGCTC 
GCGGCCTTCT ATGGCGGCAT CTGCCTCGGC CCCGTGAACA CGACGGCGGG CCATGCGCTC 
TCCTATCCGC TCGGCACGCG CCACAAGCTG CCCCACGGGA TCGCGAATGC GCTGATCTTC 
CCGCATGTGC TGGCGGCCAA CGCCTCGGCC GCGCCGGAGA AGACGGCCCG GATCTGCGCG 
GCTCTGGGCT TTGCTGCGGG CGCCGAGGAG ACGGTGCGGG CCGGTGCGCT CGCCTTCTGC 
GCCGGGCTCG GGCTCGACAT GCGGCTGCGG GCACATGGCG TGCCGTCCGA GGATCTGCCG 
GTCATGGCGG CGGAGGCGCA TGGCATCCGC CGCCTGCTCG ACTGGAACCC GCGCGACCTG 
AGCGTGGCCG AGATCGAGGC GATCTACCGC CGCGCCTACT GA

Protein sequence

MADDLTRPIT LLRPAAVHFG EGSLARLPEW VAARGFRAPF VIADAVNAQR LDRLGLGSVG 
CFGTVVPEPD TANLQAAVAA AEGADLIVGF GGGSAMDLAK LVAVLVGTGL ALSDISGPGR 
APARRVGLVQ VPTTAGTGSE VGTRALVTDP ASLAKIATES AEMLADMAIV DPALTLSVPP 
AVTAATGVDA MAHCAEALTS KRAHPLVDAY ALEGIALVGR FLRRAVEDGQ DVEARAGLSL 
AAFYGGICLG PVNTTAGHAL SYPLGTRHKL PHGIANALIF PHVLAANASA APEKTARICA 
ALGFAAGAEE TVRAGALAFC AGLGLDMRLR AHGVPSEDLP VMAAEAHGIR RLLDWNPRDL 
SVAEIEAIYR RAY