Gene RPD_1502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1502
Symbol
ID	4021981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1673176
End bp	1674783
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	65%
IMG OID	637961696
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_568640
Protein GI	91975981
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGACA CGTATGACTT TGTCGTGGTC GGCGGAGGCT CCGGCGGTTG CGCCGTTGCC 
GGCCGGCTAT CGGAAGATCC GGGCACATCG GTGGCGCTGC TCGAGGCCGG CGGCACCGCG 
GACAATTGGG TGGTGAAGAC GCCCTACGCG CTGTCGCTGA TGGTGCCGGG CAAGCTCAAC 
AACTGGCACT TCGAGACCGT GCCGCAAGCC GGCCTCAACG GCCGCATCGG CTATCAGCCG 
CGCGGCAAGG GGCTGGGCGG ATCGTCGGCG ATCAACGCCA TGGTCTATAT CCGCGGCCAC 
AAATGGGATT ACGACCATTG GGCCGAACTC GGCAATGCGG GCTGGTCCTA CGAAGACGTT 
CTGCCTTACT TCAAGCGCTC GGAGAATAAT TCCGACTTCA ACGGCGCGTA TCACGGCCAG 
AATGGTCCGC TGCACGTCAA CAAGCTCCGC ACCGACAATC CGGCGCACGA CATCTTCCTG 
CAGGCGGCGC GCGAAGCGCA ATTCCGAATT CGCGACGACT TCAATGGCGA GGAGCAGGAA 
GGCCTCGGCC TGTATCAGCT CACCCAGCAC AATGGCGAAC GCTGGAGCGC GGCGCGCGCT 
TATGTGCATC CCTATATGAC GACGCGGCCC AATCTGCGCG TCGAAACGCA GGCGCAGGCG 
ACACGCATCT TGTTCGAAGG CGGCCGCGCG GTCGGCGTCG AATATCGCCA GAACAACGAG 
ACGCGGCAGG TCCGCGCCCG CCGCGAAGTG ATCGTCGCAT CCGGCGCATT CCAGACGCCG 
CAACTGCTGT TGCTATCCGG CGTCGGCGAC GGCGCCGCGT TGAAAAGCCA CGGCATCGCA 
TCGATGCATC ATCTGCCGGG GGTCGGGCAG AATCTGCAGG ATCATCCCGA CTTCATCTTC 
TCCTACATGT CGGACAGCCC TCACTTTACG GGCACCAGCT TCAACGGCAT CGGCCGGCTG 
CTGTCGAGCA TCGGCCTGTA TCGCCGCGAG GGCCGCGGCC CGCTGACGAC CAATTTCGCC 
GAGTGCGGCG GCTTCCTGAA AACGCGGCCG GATCTCGACA TTCCCGACAT TCAGCTGCAT 
TTCGGGATGG CGATGGTCGA CGACCACGGC CGCAAGCGGC ACTGGGGCAC GGGCTTCTCC 
TGCCACGTCT GCCTGTTGCG GCCGAAGAGC CGCGGCCGCG TCGGGTTGAC CAGCGCCGAT 
CCGCTGGCAC CGCCGCTGAT CGATCCGAAC TTCTTCGGCG AGCCGGACGA TCTCGAGGCG 
ATGGTCGCCG GTTACAAAAC GACGCAGCGG CTGGTGGACG CACCGGCGTT GCGCGCGCTG 
CAGCAGAAGA ACCTGTTCAC AGCGGATGTC CGCACCGACG ACGACATCCG CGCCATCCTG 
CGCGCCCGCA CCGACACCGT GTATCACCCC GTCGGCACCT GCAAGATGGG CACGAACGAT 
CCGATGGCGG TGGTCGATTC ACGGCTCAGG GTTCACGGCG TCGGAGCCTT GCGCATCGTC 
GACGCCTCGG TGATGCCGAC CCTGATCGGC GGCAACACCA ACGCGCCGAC GATCATGATC 
GGCGAGAAGG CGGCGGATAT GATTCGGGAA GAGATGCGGG CGATGTGA

Protein sequence

MTDTYDFVVV GGGSGGCAVA GRLSEDPGTS VALLEAGGTA DNWVVKTPYA LSLMVPGKLN 
NWHFETVPQA GLNGRIGYQP RGKGLGGSSA INAMVYIRGH KWDYDHWAEL GNAGWSYEDV 
LPYFKRSENN SDFNGAYHGQ NGPLHVNKLR TDNPAHDIFL QAAREAQFRI RDDFNGEEQE 
GLGLYQLTQH NGERWSAARA YVHPYMTTRP NLRVETQAQA TRILFEGGRA VGVEYRQNNE 
TRQVRARREV IVASGAFQTP QLLLLSGVGD GAALKSHGIA SMHHLPGVGQ NLQDHPDFIF 
SYMSDSPHFT GTSFNGIGRL LSSIGLYRRE GRGPLTTNFA ECGGFLKTRP DLDIPDIQLH 
FGMAMVDDHG RKRHWGTGFS CHVCLLRPKS RGRVGLTSAD PLAPPLIDPN FFGEPDDLEA 
MVAGYKTTQR LVDAPALRAL QQKNLFTADV RTDDDIRAIL RARTDTVYHP VGTCKMGTND 
PMAVVDSRLR VHGVGALRIV DASVMPTLIG GNTNAPTIMI GEKAADMIRE EMRAM