Gene RPB_1871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1871
Symbol
ID	3908066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2134880
End bp	2135932
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	68%
IMG OID	637883765
Product	alcohol dehydrogenase
Protein accession	YP_485490
Protein GI	86748994
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.843746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.357791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGCT TTCGCGTCTC GGGCTTCGGC CAGCCGCTTA GCGAAGACAA CCGGCCGACG 
CCGGAATTGA CCGGCACGCA GGTGCTGCTG CGCGTCAAGG CCGCCGGCAT CTGCCACAGC 
GATCTGCACA TCTGGGAGGG CGGCTACGAA CTCGGCCACG GCCGCAAGAA GCTGTCGCTG 
GCCGATCGCG GCGTGGCATT GCCGCTGACG ATGGGGCACG AGACCGTCGG CGAGATCGTC 
GCCGCAGGAC CCGACGCCAA GGATGCGAAG ATCGGCGATG TCGCGCTGGT GTATCCGTGG 
ATCGGCTGCG GCCAATGCGC GGTGTGTCGC GAAGGCGACG AGAACATGTG CCTCAAGCCG 
CGGTTCCTCG GCGTGTATTG CGACGGCGGC TATTCCGACG AACTGATCGT GCCGCATCCG 
CGCTATCTGC TCAGCCTCGA CGGGCTCGAT CCGGTGACCG CGGCGCCGTA TGCGTGTTCG 
GGCGTCACCA CCTACAGCGC GCTGAAGAAG CTGGAATTCG CCTTCGACGG TCCGATCGTG 
ATGTTCGGCG CCGGCGGGCT CGGGCTGATG GCGCTGTCGC TGCTGAAGGC GATGGGCGGC 
AAGGGCGCGA TCATGGTCGA TATCGACGCC AGGAAGCGCG AGGCGGCGGA GCAGGCCGGC 
GCGATGGCGA CGGTCGACGG CGCGGCGCCC GACGCGCTGG AGCAAATCGC CAAGAAGGCC 
GGCGCGCCGG TGCGTGGCGC GCTCGACCTC GTCGGCAATT CGCAGACCGC GCAACTCGGC 
TTCGACTGTC TCACCAAAGG CGGCAAGCTG GTGATCGTCG GCCTGTTCGG CGGCGGCGCG 
CCATGGGCGC TGCCGTTCAT CCCGATGCGC GCGATCACGA TTCAGGGCTC GTATGTCGGC 
AATCTGCGCG AGACCCAGGA ACTGCTCGAT CTGGTGCGCG CCAACAAGAT CGCGCCGATT 
CCGGTGACGC CGCTGCCGCT GCCCAAGGCC AACGAGGCGC TGATGGATCT GCAGAAGGGG 
CGGTTGGTCG GCCGCGCGGT GCTGACGCCG TGA

Protein sequence

MKSFRVSGFG QPLSEDNRPT PELTGTQVLL RVKAAGICHS DLHIWEGGYE LGHGRKKLSL 
ADRGVALPLT MGHETVGEIV AAGPDAKDAK IGDVALVYPW IGCGQCAVCR EGDENMCLKP 
RFLGVYCDGG YSDELIVPHP RYLLSLDGLD PVTAAPYACS GVTTYSALKK LEFAFDGPIV 
MFGAGGLGLM ALSLLKAMGG KGAIMVDIDA RKREAAEQAG AMATVDGAAP DALEQIAKKA 
GAPVRGALDL VGNSQTAQLG FDCLTKGGKL VIVGLFGGGA PWALPFIPMR AITIQGSYVG 
NLRETQELLD LVRANKIAPI PVTPLPLPKA NEALMDLQKG RLVGRAVLTP