Gene Smed_3373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3373
Symbol
ID	5324257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3575288
End bp	3576160
Gene Length	873 bp
Protein Length	290 aa
Translation table	11
GC content	64%
IMG OID	640792324
Product	methylated-DNA--protein-cysteine methyltransferase
Protein accession	YP_001329029
Protein GI	150398562
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTTG CTACATCCAT TCCCACCGAC ATCACTCCGG AAGGCACCGA CTACGACACG 
GTGACTCGTG TCATCGCGAT GCTGACCGAA GACTATCGCG AGCAGCCGTC GCTCGAGTCG 
CTCGCCCGTC GCCTCGGGCA GTCGCCGACG CAACTTCAGA AAGTTTTCAC CCGTTGGGCG 
GGGCTCTCAC CCAAGGCCTT TCTGCAGGCA ATCACTCTCG ATCACGCCAA ACGGCTCCTG 
CGCCAGGAAG ACCTGCCGTT GCTGGAGACC AGCATTGAGA TCGGCCTGTC CGGGCCGAGC 
CGGCTGCACG ATCTCTTCGT AACGCATGAG GCGATGTCCC CCGGTGAATG GAAAGCGCGC 
GGCGCGGGCC TTACCATCCG CTACGGGTTT CACCCTTCAC CCTTCGGGAC GGCGCTGGTC 
ATGGTGACCG AGCGCGGTCT CGCCGGACTG GCCTTCGCCG ATTCAGGCGA GGAGCACGCG 
AGCTTCGAGG ACATGGCCTC CCGCTGGCCG AACGCAATCT ACCTTGAAGA CAGCGCTGCA 
ACGGCGCGCT ATGCGGCGCG CATTTTCGAC CCCGATCGGT GGTCCGCGGA GGAGCCGCTG 
AGGATTTTTC TGATCGGCTC CGATTTTCAG GTCCGCGTAT GGCAGACGCT TCTCAAGATT 
CCGCTCGGTA AGGCAACGAC CTATTCGAAA ATCGCGGAGA ATATCGGCCA GCCAACCGCT 
TCGCGCGCCG TCGGCGCCGC GGTGGGGCGC AATCCGATCT CCTTCGTCGT GCCCTGCCAC 
CGGGCGCTCG GCAAGGCCGG CGATCTCACC GGCTACCATT GGGGGCTGAC GCGCAAGCGC 
GCGATCCTCG GCTGGGAGGC GGGGAAGGCC TGA

Protein sequence

MNVATSIPTD ITPEGTDYDT VTRVIAMLTE DYREQPSLES LARRLGQSPT QLQKVFTRWA 
GLSPKAFLQA ITLDHAKRLL RQEDLPLLET SIEIGLSGPS RLHDLFVTHE AMSPGEWKAR 
GAGLTIRYGF HPSPFGTALV MVTERGLAGL AFADSGEEHA SFEDMASRWP NAIYLEDSAA 
TARYAARIFD PDRWSAEEPL RIFLIGSDFQ VRVWQTLLKI PLGKATTYSK IAENIGQPTA 
SRAVGAAVGR NPISFVVPCH RALGKAGDLT GYHWGLTRKR AILGWEAGKA