Gene Rpal_4251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4251
Symbol
ID	6411935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4567689
End bp	4569308
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	68%
IMG OID	642714133
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001993222
Protein GI	192292617
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.773505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCAC GGATCGAAGG CGAATTCGAC ACCATCGTGG TGGGCGCGGG CACCGCAGGT 
TGCATCGTCG CCAACCGCCT ATCCGCCGAT CCGAGCCGGA AGGTGCTGCT GCTCGAAGCC 
GGCGGCCGCG ACAACTGGAT CTGGTTTCAC ATTCCGGTCG GCTATCTGTT CGCGATCGGC 
AATCCGCGCT CCGACTGGAT GTTCAAGACC GAGCCCGAGC CGGGCCTGAA TGGTCGGTCA 
TTGGCCTATC CGCGCGGCAA GGTGATCGGC GGCTCCTCGG CGATCAACGC GATGATCTCG 
ATGCGCGGCC AGGCCGCCGA TTACGACCAT TGGCGTCAGC TCGGCCTCGC CGGCTGGGGC 
TGGGACGATG TCCGCAAGGT GTTCCGCCGG CTCGAAGACC ACTTCCTCGG CGACAGCGAG 
CATCACGGCG CCGGCGGCGG CTGGCGGATC GAGGCGGCGC GGCTGTCATG GCCGATCCTC 
GATGCGGTGG CGAACGCCGC CTGCGAGATG GGGATCCCGC GCAGCGCCGA CTTCAACACC 
GGCGACAACG AGGGCGTCGG CTATTTCCAC GTCAACCAGA AGCGCGGCCG GCGCTGGTCG 
TCGGCGCGCG GCTTTCTCAA GCCCGCGCTG CATCGCTCCA ACCTGCGGCT CGAAACCAAT 
GTCGTGGTCG ACCGCGTGCT GGTCGAGAAC GGCCGCGCCG TCGGCGTGCG CTTCCTGCAG 
AACGGCGTGC CGATCGAAGC CCGCGCGCGC CGTGAGGTGG TGCTGTGCGC CGGCGCGATC 
GGCTCGATCC AGGTGCTGCA TCGCTCCGGC ATCGGCCCGG CCGAATGGCT GAAGCCGCTC 
GGCATCGAGC CGGTGCTCGA TCGCCCCGGC GTCGGGCGCA ACCTGCAGGA CCATCTGCAG 
CAGCGCGCGA TCTACAAGGT CAGCGGTGGC CGCACGCTGA ACGAGATCTA TCACTCGCTG 
CCGCGCCGCG CCTGGATGGG ACTCGACTAC GCGCTGCGCC GGCGCGGGCC GCTCACCATG 
GCGCCGTCGC AGCTCGGCAT CTTCACCCGC TCCGATCCGC ATCAGGAGCG CGCCAACATC 
CAGTTCCACG TGCAGCCGCT GTCGCTCGAC AAGTTCGGCG ATCCGCTGCA TCGCTTCCCG 
GCGATCACCG TGAGCGCCTG CAACCTGCGG CCGACCTCGC GCGGCGAGAT CAAGCTGAAA 
TCCACCGCGC TCGACGCCGC GCCGTCGATC GCGCCGCATT ATCTGTCGAC CGCGGACGAC 
TGCCGCGTCG CAGCCGATGC GATCCGCGTC ACGCGGCGGC TAATGAAGCA GCACGCGCTG 
GCGACGTATC ACCCGGAGGA GTATCTGCCC GGCCCGTCGG TCGGCGACGA CGACGCCTCG 
CTCGCCAAGG CCGCCGGTGA CATCGGCACT ACGATCTTCC ATCCCGTCGG CACCGCCAAA 
ATGGGCCGCG CCGACGATCC GCTCGCGGTC GTCGATGAAA GACTTCGCTT CCACGGCCTC 
GAAGCCTTGC GCGTCGTCGA CGCCTCGATC ATGCCGACGA TCACCTCCGG CAACACCAAC 
ACCCCCACCG CAATGATCGC CGAGAAGGGC GCGACGATGA TCCTGGAGGA CGGGAAGTAA

Protein sequence

MTARIEGEFD TIVVGAGTAG CIVANRLSAD PSRKVLLLEA GGRDNWIWFH IPVGYLFAIG 
NPRSDWMFKT EPEPGLNGRS LAYPRGKVIG GSSAINAMIS MRGQAADYDH WRQLGLAGWG 
WDDVRKVFRR LEDHFLGDSE HHGAGGGWRI EAARLSWPIL DAVANAACEM GIPRSADFNT 
GDNEGVGYFH VNQKRGRRWS SARGFLKPAL HRSNLRLETN VVVDRVLVEN GRAVGVRFLQ 
NGVPIEARAR REVVLCAGAI GSIQVLHRSG IGPAEWLKPL GIEPVLDRPG VGRNLQDHLQ 
QRAIYKVSGG RTLNEIYHSL PRRAWMGLDY ALRRRGPLTM APSQLGIFTR SDPHQERANI 
QFHVQPLSLD KFGDPLHRFP AITVSACNLR PTSRGEIKLK STALDAAPSI APHYLSTADD 
CRVAADAIRV TRRLMKQHAL ATYHPEEYLP GPSVGDDDAS LAKAAGDIGT TIFHPVGTAK 
MGRADDPLAV VDERLRFHGL EALRVVDASI MPTITSGNTN TPTAMIAEKG ATMILEDGK