Gene Smed_4865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4865
Symbol
ID	5318850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1365728
End bp	1367347
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	61%
IMG OID	640776650
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001313582
Protein GI	150376986
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.69396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.438414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGAGG AGCCGAACGT GAACGAAGCG CAATTTGATT ACATCGTGGT CGGTGCCGGC 
TCTTCGGGCT GCACCGTTGC CGCACGTCTC TCGGAAGACG GCAGGTTCCG TGTTGCTCTC 
GTCGAAGCGG GGCCGAAAGA CACCAGCCCC TGGATTCACT TGCCGCTCGG TTACGGCAAG 
ACGATGTGGG ATGAGCGCAT CAACTGGAAG CTTTACACCG AGCCCGATCC CAACATGAAC 
GGCCGACGCA TCTATTGGCC GCGCGGCAAG GTTCTGGGGG GCTGCTCGGC GATCAACGGT 
CTGATTGCCA TCCGGGGACA GGCCGAGGAC TATGACGACT GGGCGCGCTA CGGCGGGGAT 
CAGTGGAACT ATCGCAACGT CCTGCCCCAT TTCCGTAAGT CCGAATCCTT CGCGGGCGCC 
GCAAACCCCG AGTTCCACGG CAAGCACGGG CCGATCTGCG TCGCTCCGAT CCGCCACCGT 
CATCCGCTGA TCGACGCATT CATCGGCTCG GCCAATCAGC TTGGCATCCC CTGCAACGAT 
GATTTCAACG GTCCGTCGCA GGAAGGCGTG GGCTACTACA GCCTGACGAC CAGAAACGGA 
ATGCGCAGCA GCGCGGCGGT GGGTTATCTC CGCCCGGCAA AACGGCGGAG CAACCTTACG 
ATCGTCACGG AAGCGCTGGT CACGAAAGTC CGCTTTGAGG GGCGCCGGGC GCAGGGCATC 
GACTACACTA CAAATGGTCG CAAGATGAGC ATGAATGCGC GGCGTGGCGT CATCCTTAGC 
GCGGGCGCCG TGCATACACC GCACCTGATG ATGCTGTCCG GCATCGGACC GGCCGCGCAT 
CTCAAGGCTC ACGGCATCGA CGTCGTGGCG GACATGCCTG GCGTTGGTGC TAATCTGCGA 
GATCACCTGC AGCTCCGGCT TATCTATCGC TGCAACAGAC CCATCACCAC GAATGACGAA 
CTGAACAGTC TGACCGGCAA GGTGAAAATC GGACTGCAAT GGTTGCTGAC GCGAACTGGA 
CCCCTTGCCG TCGGCATCAA CCAGGGTGGG CTCTTCGCCA GGGTCATGCC CGATGCGACG 
CGACCCGACG TTCAATTTCA TGTCGCCACA CTTTCCGCGG ACATGGCCGG AGGAAAAGTC 
CATCCCTTCT CCGGCTTTAC CATGTCGGTC TGTCAGCTCC GGCCCGAGAG CCACGGCACC 
ATTCGGCTGG CCTGCGCGGA CCCCACGACA CCGCCGCTGA TACACGCCAA TTATCTCGAC 
GCCGAACTCG ACCGTCAGAT TGCGATCGGC GGCATCAGAC TGGCCCGCCG CATCGCGCGC 
ACAGGTCCGC TGAGCCAGCT CGTAACCCGC GAAGAACTGC CGGGCGAGTC CGTCGACAGC 
AAGGAAGGAA TTCTCGATTT CGCGCGCCAG AACGGCGCAA CGATCTTCCA TCCAACGAGC 
ACATGCCGAA TGGGCCAGGA CGACGATGCG GATGCAGTGG TCCGCCCCGA CCTGAAAGTG 
AGAGGCTTCG ACGGCCTTTG GATCGCGGAT TGTTCGGTGA TGCCCACCAT CGTGTCGGGA 
AACACCAACC TGCCGGCAAT CATGATCGGA GAGAAACTGT CGAGCTCAAT TCTGAACTGA

Protein sequence

MREEPNVNEA QFDYIVVGAG SSGCTVAARL SEDGRFRVAL VEAGPKDTSP WIHLPLGYGK 
TMWDERINWK LYTEPDPNMN GRRIYWPRGK VLGGCSAING LIAIRGQAED YDDWARYGGD 
QWNYRNVLPH FRKSESFAGA ANPEFHGKHG PICVAPIRHR HPLIDAFIGS ANQLGIPCND 
DFNGPSQEGV GYYSLTTRNG MRSSAAVGYL RPAKRRSNLT IVTEALVTKV RFEGRRAQGI 
DYTTNGRKMS MNARRGVILS AGAVHTPHLM MLSGIGPAAH LKAHGIDVVA DMPGVGANLR 
DHLQLRLIYR CNRPITTNDE LNSLTGKVKI GLQWLLTRTG PLAVGINQGG LFARVMPDAT 
RPDVQFHVAT LSADMAGGKV HPFSGFTMSV CQLRPESHGT IRLACADPTT PPLIHANYLD 
AELDRQIAIG GIRLARRIAR TGPLSQLVTR EELPGESVDS KEGILDFARQ NGATIFHPTS 
TCRMGQDDDA DAVVRPDLKV RGFDGLWIAD CSVMPTIVSG NTNLPAIMIG EKLSSSILN