Gene RPB_1733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1733
Symbol
ID	3908258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1978443
End bp	1980092
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	68%
IMG OID	637883627
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_485352
Protein GI	86748856
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0167412
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0176419
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTGGC AAACCACACG TGGAACGGGA CGGATGACGC AGATCGAGGG CGAATTCGAC 
TATATCGTGG TGGGCGCCGG CACTGCCGGC TGCATCGTCG CCAACCGGCT GTCGGCCGAT 
CCGAATTGTC GGGTGCTGCT GCTGGAAGCC GGCGGCCGCG ACAACTGGAT CTGGTTTCAC 
ATCCCGGTCG GCTATCTGTT CGCGATCGGC AATCCGCGCT CGGACTGGAT GTTCAGGACC 
GAGCCGGAGC CCGGCCTCAA TGGTCGGTCA TTGGCCTATC CGCGCGGCAA GGTGATCGGC 
GGCTCCTCGG CCATCAACGC GATGATCTCG ATGCGCGGCC AGGCCGCCGA TTACGACCAC 
TGGCGCCAGC TCGGCCTGTC CGGTTGGGGC TGGGACGACG TTCGCCAGGT GTTCCGGCGG 
CTGGAGGATC ACTTCCTCGG CGACAGCGAG CATCACGGTA AAGGCGGCGG CTGGCGGATC 
GAGGCGGCGC GGCTGTCCTG GCCGATCCTC GACGCGGTGG CCGACGCCGC CGGCGAGATG 
GGCATCCCGC GCAGCGCCGA TTTCAACACC GGCGACAACG AGGGCGTCGG CTATTTCCAC 
GTCAACCAGA AGCGCGGCCG GCGCTGGTCG TCGGCGCGCG GTTTCCTCAA GCCGGCGCTG 
CACCGGCCGA ATCTGAGGCT GGAAACCGGT GTCGTCACCG ACCGCGTGAT AGTCGAGAAC 
GGCCGAGCCG TCGGCGTGCG GTTCCAGCAA GGCGGCGGCG TGGTCGAGGC GCGGGCGCGG 
CGCGAGGTGG TGCTGTGCGC GGGATCGATC GGCTCGGTGC AAGTGCTGCA GCGTTCAGGC 
ATCGGGCCGG CGGAATGGCT CACCCCGCTC GGCATCGATC CGGTGCTCGA TCGCCCGGGC 
GTCGGCCGCA ATCTGCAGGA CCATCTGCAG CAGCGCGCGA TCTATCGCGT CAGCGGCGGC 
CGCACCCTGA ACGAGATCTA TCACTCGCTG CCGCGGCGCG CCTGGATGGG CATGGACTAC 
GCGCTGCGTC GGCGCGGCCC GCTGACGATG GCGCCATCGC AGCTCGGCAT CTTCACCCGC 
TCCGATCCGC ATCAGGAGCG CGCCAACATC CAGTTTCACG TCCAGCCATT GTCTCTGGAT 
AAATTCGGCG ACCCGCTGCA CCGCTTCCCG GCGATCACCG TCAGCGCCTG CAACCTGCGG 
CCGACCTCGC GCGGCGAGAT CAAGCTGAAA TCCACCGCGC TCGACGCCGC CCCCTCGATT 
GCGCCGCATT ATCTGACGAC CGCCGACGAC CGCCGCGTCG CCGCCGACGC GATCCGCTGT 
ACGCGCCGGC TGATGCAACA GCAGGCGCTG GCGAAGTATC AACCCGAGGA GTATCTGCCC 
GGCCGCGCGG TGGGCGACGA CGACGCCTCG TTGGCGAAAG CCGCCGGCGA CATCGGCACC 
ACGATCTTCC ATCCGGTCGG CACCGCCAAG ATGGGCCTCG CCAGCGATCC GATGGCGGTG 
GTCGACGAAC GCTTGCGCCT GCACGGCCTC GACGGCCTGC GCGTCGTCGA CGCCTCGGTG 
ATGCCGACGA TCACCTCCGG CAACACCAAT ACGCCGACCG CGATGATCGC CGAGAAAGGC 
GCGACGATGA TGCTGGAGGA TGGGAAGTAA

Protein sequence

MSWQTTRGTG RMTQIEGEFD YIVVGAGTAG CIVANRLSAD PNCRVLLLEA GGRDNWIWFH 
IPVGYLFAIG NPRSDWMFRT EPEPGLNGRS LAYPRGKVIG GSSAINAMIS MRGQAADYDH 
WRQLGLSGWG WDDVRQVFRR LEDHFLGDSE HHGKGGGWRI EAARLSWPIL DAVADAAGEM 
GIPRSADFNT GDNEGVGYFH VNQKRGRRWS SARGFLKPAL HRPNLRLETG VVTDRVIVEN 
GRAVGVRFQQ GGGVVEARAR REVVLCAGSI GSVQVLQRSG IGPAEWLTPL GIDPVLDRPG 
VGRNLQDHLQ QRAIYRVSGG RTLNEIYHSL PRRAWMGMDY ALRRRGPLTM APSQLGIFTR 
SDPHQERANI QFHVQPLSLD KFGDPLHRFP AITVSACNLR PTSRGEIKLK STALDAAPSI 
APHYLTTADD RRVAADAIRC TRRLMQQQAL AKYQPEEYLP GRAVGDDDAS LAKAAGDIGT 
TIFHPVGTAK MGLASDPMAV VDERLRLHGL DGLRVVDASV MPTITSGNTN TPTAMIAEKG 
ATMMLEDGK