Gene Rsph17029_4024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4024
Symbol
ID	4899060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	1170380
End bp	1171981
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	69%
IMG OID	640114627
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001045874
Protein GI	126464761
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGCCG ATTACATCAT CGTGGGGGCG GGCAGCGCAG GCTGCGTGCT GGCGAACCGC 
CTGTCCAAGG ATCCCTCGAA CCGCGTGCTG CTGATCGAGG CGGGCAAGCG CGACAATTAC 
CACTGGGTGC ATATCCCGGT GGGCTATCTC TACTGCATCA ACAATCCCCG CACCGACTGG 
TGCTTCACCA CCGAGCCCGA GGAAGGGCTC GAGGGTCGCA GCCTGATCTA TCCCCGCGGC 
AAGGTGCTCG GCGGCTGTTC CTCGATCAAC GGCATGATCT ACATGCGCGG GCAGGCCGAG 
GATTACGACG GCTGGCGCCA GATGGGCTGC ACCGGCTGGG GCTGGGACGA TGTGCTGCCC 
CTCTTCCGCC GCCAGCAGGA CCACCACCGC GGCGAAAGCG AACATCACGG CGCGGGCGGC 
GAATGGCGGG TGGAGCGGGC GCGGGTCCGC TGGGCAGTGC TCGACGCTTT CCTCGATGCG 
GCCGAGCAGG CGGGCATCCC GCGGACCGAG GATTTCAACC GCGGCTCGAA CGAGGGCGGC 
GGCTATTTCG ACGTGAACCA GAGGTCCGGC ATCCGCTGGA ACACGGCCAA GGCCTTCCTG 
AAGCCCGCCC TCTCCCGCCC GAACCTGCGC GTCGTGACCG AGGCGCAGGT CGAGCGGCTG 
ATCGTCGAGG CGGGCGAGGT GCGGGGCGTG CTCTACCGGC AGGGCGGCAC CCTGCACGAG 
GCCCGGGCGC GGCGCGAGAC GGTCCTTGCG GCGGGTGCCA TCGGCTCGCC GCACATTCTG 
GAGCTTTCGG GCATCGGCGA TCCCGAGGTG CTGCGCGCGG CGGGCGTCGA GCCGCAGGTC 
GCCGTGCCGG GCGTGGGCGC GAACCTGCAG GATCACCTGC AGCTCCGCCT CGTCTTCAAG 
GTGCGGGGCG TGCCCACGCT GAACGAGAAG GCCACCAGCC TCTTCGGCCG TGCCGCGATC 
GGGGCGGAAT ATCTCCTGCG CCGGTCGGGG CCGATGTCGA TGGCACCGAG TCAGGTCGGG 
ATCTTCACCC GCTCCGGCTC CGAGAAGGCC ACGCCCGATC TCGAGTTCCA TGTCCAGCCG 
GTCTCGCTCG ACAAGTTCGG CGACAAGGTC CACCCCTTCC CCGGCATGAC GGCGAGCGTC 
TGCAACCTTC GCCCCGAAAG CCGCGGCAGC GTCCATCTGA AAAGCCCCGA TCCCGCGCGT 
CAGCCCGCCA TCGCGCCGCA CTATCTTTCG ACCGAGGGCG ACCGCGAGGT GGCGGTGCGC 
TCGATCCAGA TCGCGCGCCA TATCGCCTCG CAGCCCGCCT TTGCGCGGTT TCACCCCGAG 
GAATACCGTC CGGGAGCCGA GCACGACACG CGCGAGGCGC TGGTCGCCGC CGCGGGCCGC 
ATCGGTACCA CGATCTTCCA CCCGGTCGGC ACCTGCCGCA TGGGGTCGGA TCCGGCGAGC 
GTCGTCGATC CGCGGCTGAA GTTCCGGGCG CTCGGCGGCC TCAGGATCGC GGATGCGTCG 
ATCATGCCGG CCATCACCTC GGGAAACACC AACTCGCCCA CCCTCATGAT TGCCGAGAAG 
GCGGCCGAGA TGATCCTCGA GGATGCCCGG CAGCGGGTTT GA

Protein sequence

MEADYIIVGA GSAGCVLANR LSKDPSNRVL LIEAGKRDNY HWVHIPVGYL YCINNPRTDW 
CFTTEPEEGL EGRSLIYPRG KVLGGCSSIN GMIYMRGQAE DYDGWRQMGC TGWGWDDVLP 
LFRRQQDHHR GESEHHGAGG EWRVERARVR WAVLDAFLDA AEQAGIPRTE DFNRGSNEGG 
GYFDVNQRSG IRWNTAKAFL KPALSRPNLR VVTEAQVERL IVEAGEVRGV LYRQGGTLHE 
ARARRETVLA AGAIGSPHIL ELSGIGDPEV LRAAGVEPQV AVPGVGANLQ DHLQLRLVFK 
VRGVPTLNEK ATSLFGRAAI GAEYLLRRSG PMSMAPSQVG IFTRSGSEKA TPDLEFHVQP 
VSLDKFGDKV HPFPGMTASV CNLRPESRGS VHLKSPDPAR QPAIAPHYLS TEGDREVAVR 
SIQIARHIAS QPAFARFHPE EYRPGAEHDT REALVAAAGR IGTTIFHPVG TCRMGSDPAS 
VVDPRLKFRA LGGLRIADAS IMPAITSGNT NSPTLMIAEK AAEMILEDAR QRV