Gene RPB_3418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3418
Symbol
ID	3911220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3906995
End bp	3908104
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	65%
IMG OID	637885321
Product	alcohol dehydrogenase
Protein accession	YP_487025
Protein GI	86750529
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR02818] S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.128659
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.268531
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACCC GCGCCGCCGT CGCATTCGAG GCCAAGAGGC CGCTCGAAAT CGTCGAACTG 
GATCTCGACG GGCCGAAGGC CGGCGAAGTG CTGGTCGAGA TCAAGGCGAC CGGGATCTGC 
CACACCGACG CCTATACGCT CGACGGCCTC GACTCCGAAG GCATCTTCCC CTCGATCCTC 
GGCCACGAGG GCGCGGGCAT CGTGCGCGAG GTCGGCGCCG GCGTCACCTC GGTGAAGCCC 
GGCGATCACG TCATTCCGCT GTACACGCCG GAGTGCCGGC AGTGCAAAAG CTGCCTGAGC 
CAGAAGACCA ATCTGTGCAC CTCGATCCGC GCCACCCAGG GCAAGGGCGT GATGCCGGAC 
GGCACCTCGC GCTTCAGCTA TCAGGGCAAG CCGATCTATC ATTACATGGG CTGCTCGACG 
TTTTCGAACT TCACCGTGCT GCCGGAGATC GCGCTGGCGA AGATCCGCGA CGACGCGCCG 
TTCGACAAGA GCTGCTACAT CGGCTGCGGC GTCACCACCG GCGTCGGCGC GGTGGTCAAC 
ACCGCGAAGG TGACGCCCGG CTCCAATGTC GTGGTGTTCG GCCTCGGCGG CATCGGCCTC 
AACGTCATTC AGGGCGCGCG GATGGTCGGC GCCGACAAGA TCGTCGGCGT CGACATCAAC 
GACGACAAGG AGGAATGGGG CCGCCGCTTC GGCATGACGC ATTTCGTCAA TCCGAAGACA 
ATCGACGGCG ACATCGTCCA GCACCTCGTC GGCCTGACCG ACGGCGGCGC CGACTACACG 
TTCGACTGCA CCGGCAACAC CACTGTGATG CGCCAGGCGC TGGAAGCCTG CCACCGCGGC 
TGGGGCGTCT CGGTGGTGAT CGGCGTCGCC GAAGCCGGCA AGGAAATCTC GACGCGGCCG 
TTCCAGCTCG TCACCGGCCG GGTCTGGAAA GGCAGCGCCT TCGGCGGCGC CCGCGGCCGC 
ACCGACGTGC CGAAAATCGT CGACTGGTAC ATGAACGGCA AGATCGAGAT CGACCCGATG 
ATCACCCACG TGCTCAAGCT CGAGGAGATC AACAAGGGTT TCGAGCTGAT GCACGAGGGC 
AAGTCGATCC GGTCGGTGGT GGTGTTCTAG

Protein sequence

MKTRAAVAFE AKRPLEIVEL DLDGPKAGEV LVEIKATGIC HTDAYTLDGL DSEGIFPSIL 
GHEGAGIVRE VGAGVTSVKP GDHVIPLYTP ECRQCKSCLS QKTNLCTSIR ATQGKGVMPD 
GTSRFSYQGK PIYHYMGCST FSNFTVLPEI ALAKIRDDAP FDKSCYIGCG VTTGVGAVVN 
TAKVTPGSNV VVFGLGGIGL NVIQGARMVG ADKIVGVDIN DDKEEWGRRF GMTHFVNPKT 
IDGDIVQHLV GLTDGGADYT FDCTGNTTVM RQALEACHRG WGVSVVIGVA EAGKEISTRP 
FQLVTGRVWK GSAFGGARGR TDVPKIVDWY MNGKIEIDPM ITHVLKLEEI NKGFELMHEG 
KSIRSVVVF