Gene Rleg2_5818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5818
Symbol
ID	6977207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	-
Start bp	228786
End bp	230381
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	64%
IMG OID	643393273
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_002278091
Protein GI	209546201
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.673966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0679471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGGT ACGACTATAT CATCATCGGG GCGGGCAGTG CCGGCTGCGT ACTTGCCAAC 
CGGCTGTCGG CCGATGGCAG GAGCCGGGTG CTGCTGTTGG AAGCCGGCGG CAGCGACAAT 
TACCACTGGA TCCATATCCC GGTCGGTTAT CTCTATTGCA TCAATAATCC GCGCACCGAC 
TGGTGTTTCA CCACGGCGCC GGAAGCCGGA TTGAACGGCC GGGCGCTGAG TTATCCCCGC 
GGCAAGGTGC TCGGCGGCTG CTCGTCGATC AACGGCATGA TCTATATGCG CGGCCAGGCG 
CGGGACTATG ATCTTTGGCG GCAGATGGGC TGCAGCGGTT GGGGCTGGGA CGATGTTCTG 
CCCTTCTTCC GCAAGTCCGA GGATTTCTAT CGCGGCGCCG ACGACATGCA CGGCGCCGGC 
GGCGAATGGC GCATCGAAAG GGCGCGCGTG CGCTGGGCCG TGCTCGACGC CTTCCAGCAG 
GCGGCGCGAG AGGCAGGCAT TCCAGAGACG GCGGATTTCA ACCGCGGCAG CAATGAAGGG 
TCCGGCTATT TCGACGTCAA CCAGCGTTCC GGCATTCGCT GGAACACCTC GAAAGCCTTC 
CTGCGCCCGG CGCGGAAACG CTCCAATCTG ACCGTGCTGA TCAAGGCGCA GGTGCGGCGG 
TTGCTGGTCG AGGAGGGGGC CGTCGCCGGC GTCGAATACC AGCACAATGG CGTGGCGAAA 
CGCGCCTATG CGGGCAAGGA AACCATTCTG TCGGCCGGTT CGATCGGCTC GCCGCATGTT 
CTGGAACTCT CGGGCATCGG CAGGGGCGAG GTTCTCCAGC GGGCAGGCGT CGATGTCATC 
ACCGAGGTCA AGGGCATCGG CGAGAACCTG CAGGACCATC TGCAACTGCG GCTCGCCTAT 
AAGGTGACCG GCGTTCCGAC GCTGAACGAG AAGGCGACGA AGCTGATCGG CAAGGCGGCG 
ATCGGGCTCG AATATCTCGT CCGCCGCTCC GGGCCGATGG CGATGGCGCC GAGCCAGCTT 
GGCATCTTCA CCCGCTCGGG GCCGGACCGG GAAACGCCCG ACCTGCAATA TCACGTGCAG 
CCGGTCTCGC TGGAGAAGTT CGGCGATCCC GTCCATCCTT TCCCGGCAAT CACCGCAAGC 
GTCTGCAATC TGAGGCCGGA AAGCCGCGGT TCGGTGCATC TGTCGAGCCC GGATTTTGCC 
GCCCAGCCGA CGATCAGCCC GAAATACCTC TCGACGCAGC GCGATCGTGA CATAGCTGTC 
CGTTCGATAC GATTGACGCG CAAGATCGTC GCCCAGCCTT CCTTCGCCAG GTTCAAGCCG 
GAGGAATTCA AGCCGGGGCC GAGCTATCAG ACCGAGGCCG ATCTGGAGCG GGCGGCGGGC 
GAAATCGGCA CGACGATCTT CCATCCCGTC GGCACCTGCC GCATGGGCGC CGACCGGGAC 
AGCGTCGTCG ATCCCCGGCT GAAACTGCGG GCGCTCGGCA AGCTCAGGAT CGCCGACGCC 
TCGGTGATGC CGTCGATCAC CTCAGGCAAC ACCAATTCGC CGACGATCAT GATCGCCGAA 
AAGGCAGCGG CGATGATCCT CGAAGACAAT CGATAG

Protein sequence

MDRYDYIIIG AGSAGCVLAN RLSADGRSRV LLLEAGGSDN YHWIHIPVGY LYCINNPRTD 
WCFTTAPEAG LNGRALSYPR GKVLGGCSSI NGMIYMRGQA RDYDLWRQMG CSGWGWDDVL 
PFFRKSEDFY RGADDMHGAG GEWRIERARV RWAVLDAFQQ AAREAGIPET ADFNRGSNEG 
SGYFDVNQRS GIRWNTSKAF LRPARKRSNL TVLIKAQVRR LLVEEGAVAG VEYQHNGVAK 
RAYAGKETIL SAGSIGSPHV LELSGIGRGE VLQRAGVDVI TEVKGIGENL QDHLQLRLAY 
KVTGVPTLNE KATKLIGKAA IGLEYLVRRS GPMAMAPSQL GIFTRSGPDR ETPDLQYHVQ 
PVSLEKFGDP VHPFPAITAS VCNLRPESRG SVHLSSPDFA AQPTISPKYL STQRDRDIAV 
RSIRLTRKIV AQPSFARFKP EEFKPGPSYQ TEADLERAAG EIGTTIFHPV GTCRMGADRD 
SVVDPRLKLR ALGKLRIADA SVMPSITSGN TNSPTIMIAE KAAAMILEDN R