Gene Rleg2_4610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4610
Symbol
ID	6977704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	244083
End bp	245756
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	58%
IMG OID	643393785
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_002278603
Protein GI	209546685
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.335762
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGG ATCAATTCGA TTACATTGTT ATTGGGGGCG GAAGCGCCGG CTGCGTGCTC 
GCCAACCGGC TGAGCAAGGA CCCTGCAAAA CGCGTGCTTT TGCTGGAGGC CGGCAAGAAG 
GACAATTATC CGTGGATCCA TATCCCGGTC GGATATCTCT ATTGCATCGG CAATCCGCGC 
ACAGACTGGC TGTTCAAAAC GGAGGCCGAG CCGGGACTGA ATGGCCGAAG CCTGCGTTAC 
CCGCGCGGAA AGACATTGGG CGGGTGCTCA TCGATCAACG GTATGATTTA CATGCGTGGA 
CAGGCAAGGG ACTACAACAC CTGGTCCGAG CTGACCGGAG ATGAGCGCTG GGCCTGGGAA 
AATGTTCTTC CCGCCTTCAA AGCACATGAG GATCATTACC GGCTCGACAA GGGCGCCGAT 
CCGCAAACCG GTGACAATAG CCGGTTTTCC GACATGCACG GTCACGGGGG CGAATGGCGG 
ATCGAAAAGC AGCGATTGCG CTGGGATATT CTCGAAGCGT TTGCCGACGC AGCCGTAGAG 
GCCGGCATAC CGAGATCTGC GGACTTCAAC GGTGGAGATA ACGAAGGTGT CGGCTATTTC 
GAAGTCAACC AGAAATCGGG CTGGCGCTGG AATACCTCCA AAGCCTTCCT GCGTCCGGCC 
CGAAAACGGG CAAATCTTGT CATATGGACA GAAGCCCACG TTCAAAAGCT TCTGATCAAG 
ACGGGTCCGG AAGGACAGAA GCATTGCGCC GGGGTTGTCG TTTTGCGCAA TGGCAAAGAC 
GTCACAGTCC GCGCCAGAGG CGAGGTCATT CTATCTGCCG GAGCCATCGG ATCGCCTCAG 
ATTCTGCAGC TTTCCGGGAT CGGACCGGCG GCACTGTTGC GCAAGCACGG TATCGACGTG 
GAAGTGGACC TGCCGGGTGT AGGCGAGAAC CTTCAAGACC ACCTGCAGAT CCGTGCTGTG 
TTCAAGGTCA ATGGCGTCAA AACCCTGAAT ACACTGGCGA ACAGCGTCTT CGGCAAGGTA 
AAGATCGGGC TTGAATATGC GCTTCGGCGA AGCGGGCCGA TGAGCATGTC GCCGTCGCAG 
CTTGGCGTGT TTACCCGATC CGACAACAAT CAAGCGCACG CCAATCTCGA ATACCATGTG 
CAACCTCTGA GCCTGGAAGC TTTTGGCGAG CCTCTGCACA GCGTTCCGGC ATTCACCGCG 
AGTGTGTGCA ATCTCAACCC AACGAGCAGG GGGACTGTCA GGATCCGCTC AAATCGGAGC 
GGCGATTCTC CGGCGATCGC TCCCAATTAC TTGAGCACGG ATGATGACCG CAAGATCGCA 
GCCGACAGCA TTCGCCAGAT CCGCACGGTC GTTTCGCAGC CGGCGCTCGC ACGCTATCAG 
CCCGTCGAAT GGAAGCCCGG CGTCGAGTTC CAGAGCGATG CGGAACTGGC AAAGCTTGCA 
GGCGATATCG CCAACACGAT TTTCCACCCT GTCGGAACCA CAAAGATGGG ACGCGACAAC 
GACCCTCTGG CGGTGGTCGA CAGCCATTTG CGGGTCCGGG GTATCAAAGG CCTGCGTGTC 
GTCGATGCCG GCGTCATGCC GACGATCACC AGTGGCAATA CCAATTCGCC AACAGTCATG 
ATCGCTGAAA AGGCGGCGGA AATGATACTT CGGGAGGCTG GCCAACATGC TTGA

Protein sequence

MNQDQFDYIV IGGGSAGCVL ANRLSKDPAK RVLLLEAGKK DNYPWIHIPV GYLYCIGNPR 
TDWLFKTEAE PGLNGRSLRY PRGKTLGGCS SINGMIYMRG QARDYNTWSE LTGDERWAWE 
NVLPAFKAHE DHYRLDKGAD PQTGDNSRFS DMHGHGGEWR IEKQRLRWDI LEAFADAAVE 
AGIPRSADFN GGDNEGVGYF EVNQKSGWRW NTSKAFLRPA RKRANLVIWT EAHVQKLLIK 
TGPEGQKHCA GVVVLRNGKD VTVRARGEVI LSAGAIGSPQ ILQLSGIGPA ALLRKHGIDV 
EVDLPGVGEN LQDHLQIRAV FKVNGVKTLN TLANSVFGKV KIGLEYALRR SGPMSMSPSQ 
LGVFTRSDNN QAHANLEYHV QPLSLEAFGE PLHSVPAFTA SVCNLNPTSR GTVRIRSNRS 
GDSPAIAPNY LSTDDDRKIA ADSIRQIRTV VSQPALARYQ PVEWKPGVEF QSDAELAKLA 
GDIANTIFHP VGTTKMGRDN DPLAVVDSHL RVRGIKGLRV VDAGVMPTIT SGNTNSPTVM 
IAEKAAEMIL REAGQHA