Gene RPD_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2020
Symbol
ID	4022502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2265961
End bp	2266929
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	68%
IMG OID	637962213
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_569156
Protein GI	91976497
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.322186
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.588155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCCT ATGTCTATGG CGCCGGCGGC GCCGCCATTA CCGACGTGGA CAAGCCGGCC 
CCGAAGGGAC CGCAGGTCCT GATCCGCGTC CGCGCCTGCG GCCTCAATCG CGCCGACCTC 
GGCATGACCA AGGGCCATGC CCACGGCGCG GCCGGCGGCG TCGGCGCCGT GCTCGGCATG 
GAATGGGCCG GTGAGATCGC AGCGGTCGGC GACGAGGCCT ATGGCTGCGA GGTCGGCGAC 
CGCGTGATGG GTTCGGGCGC CGCGGCGTTC GGCGAGTACA CGCTGGCCGA TCACGGCCGG 
CTGTTCCCGA TACCGGGCGG CATGAGCTTC GAGGATGCCG CCGCGCTGCC CGTCGCGCTC 
ACCACCATGC ACAACGCGCT GATCGCGGTC GGCAAGCTGC GCGCCGGCCA GTCCGTGCTG 
ATCCAGGGCG CGAGCTCCGG TGTCGGGCTG ATGGCGCTGC AGATCGCCCG GCTGAAGGGC 
GCCAAGCTGG TGATCGGCTC GTCGACCGAC AACAGCCGCC GCGACCGGCT GCGCGAGTTC 
GGCGCGGACC TCGCGATCGA TTCGTCGGGA AGCGGCTGGG TCGATCAGGT GCTCGCCGCC 
ACCGGCGGCG CCGGGGTCGA TCTGATCATC GACCAGATTT CCGGCAGCGT CGCCAACCAG 
AACCTCGCCG CGACCCGCGT GCTCGGCCGC ATCGTCAATG TCGGCCGGCT CGGCGGCGCC 
CACGCCGATT TCAATTTCGA TCTGCATGCG GCGCGGCGGA TCGACTATGT CGGCGTCACC 
TTCCGCACCC GCAGCATTGA AGAGATTCGC GAAATCTTCC GCCAGGTGCG CGGCGATATC 
TGGCCGGCTG TCGAAACACG CAAGCTGAAG TTGCCGGTGG ACCGCGTCTT CCCGTTCGCC 
GAGATCGACA AGGCCTTCGC ACACATGGAG GCAAACCGTC ATTTCGGAAA GATCGTCGTA 
ACGCTCTGA

Protein sequence

MKAYVYGAGG AAITDVDKPA PKGPQVLIRV RACGLNRADL GMTKGHAHGA AGGVGAVLGM 
EWAGEIAAVG DEAYGCEVGD RVMGSGAAAF GEYTLADHGR LFPIPGGMSF EDAAALPVAL 
TTMHNALIAV GKLRAGQSVL IQGASSGVGL MALQIARLKG AKLVIGSSTD NSRRDRLREF 
GADLAIDSSG SGWVDQVLAA TGGAGVDLII DQISGSVANQ NLAATRVLGR IVNVGRLGGA 
HADFNFDLHA ARRIDYVGVT FRTRSIEEIR EIFRQVRGDI WPAVETRKLK LPVDRVFPFA 
EIDKAFAHME ANRHFGKIVV TL