Gene Smed_0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0073
Symbol
ID	5320900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	81018
End bp	82130
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	64%
IMG OID	640789004
Product	methylated-DNA--protein-cysteine methyltransferase
Protein accession	YP_001325768
Protein GI	150395301
COG category	[F] Nucleotide transport and metabolism [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG2169] Adenosine deaminase
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.332554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTTCG ATCTTCCGAA TGATGATATC CTTTACGATG CGCTGCTGGC CCGCAGTTCC 
GATTATGAGG GCCAGGCCTT CGTCTGCGTC AAAAGCACCG GCATCTTCTG CCGGCTCTCA 
TGTCCCGCGC GCAAGCCGAA GCGGGAAAAC AGCATTTTCT TCGACAGTGT GTCCGCCTGC 
GTCAATTCCG GCTTCCGGCC GTGCCAACGC TGCCGACCGC TGGAGCAGGT GTCCGGTAAG 
GATCCGCTGG TCAAAGACCT CCTGCGACTG CTCGACAGCC GTCCGGATCA TCGCTGGACC 
GAGGGCGATC TCGTTCGGCG CGGCTTCGAT CCCTCCACCG TGCGGCGCGC CTTCAAGCGC 
AGCCTTGGCG TTACCTTTCT CGATCTCGCC CGGCAGCGGC GAATGGGTGA GGCCGCGCGC 
CAGCTCTCCG TCGGCTCCAG CGTCATCGAG GCGCAGATCG ACGCGGGCTA CGAGTCTCCG 
AGCGGTTTCC GCACCGCCTT CGCGCGGCTG GTCGGAGAGG CTCCTGCGAA ATCGCAGGGC 
CGCGTGCTGC TGTTTGCCGA CTGGGTAGAG ACGCCGCTCG GTCCGATGGT GGCCGTTGCC 
GACCGGACGC ATCTTCATCT GATCGAGTTT CATGACCGCC GCGCGCTTCC CGCGGAAATG 
GAAAAGCTCA AGCGCAAGAC GCTCTCGGCG GTGGTGCGCG GTAGAACGCC CCCCATCGAC 
CAGGCGGAGC GTGAGCTCAA GAATTATTTT GCCGGTCGCT CTGCCGATTT TCGCACGCCC 
CTTGCGATGG ACGGCAGTGC TTTCGAGCGC CAGGTATGGG CAGAACTGGT GGCGATACCC 
GCAGGGGAGA CGCGATCCTA CAGCGACATC GCGCGGAAAA TCGCCAGCCA TCAGGCGGTC 
CGGGCCGTTG CCAGGGCCAA TGGCGCCAAC TGCTTTGCAA TTCTCGTGCC TTGCCACCGC 
TGCGTCGGTG CGGACGGATC TTTGACGGGC TATGGCGGTG GGCTGCAGCG CAAGCGATGG 
CTGCTGCGCC ACGAGGGCAG AATGCATCCT GCGGAGCTGT TCAAAGGTTG GGACGGGGAG 
GAGCCGGTGC AGGCCGGCGC TCTTTCGGTT TGA

Protein sequence

MLFDLPNDDI LYDALLARSS DYEGQAFVCV KSTGIFCRLS CPARKPKREN SIFFDSVSAC 
VNSGFRPCQR CRPLEQVSGK DPLVKDLLRL LDSRPDHRWT EGDLVRRGFD PSTVRRAFKR 
SLGVTFLDLA RQRRMGEAAR QLSVGSSVIE AQIDAGYESP SGFRTAFARL VGEAPAKSQG 
RVLLFADWVE TPLGPMVAVA DRTHLHLIEF HDRRALPAEM EKLKRKTLSA VVRGRTPPID 
QAERELKNYF AGRSADFRTP LAMDGSAFER QVWAELVAIP AGETRSYSDI ARKIASHQAV 
RAVARANGAN CFAILVPCHR CVGADGSLTG YGGGLQRKRW LLRHEGRMHP AELFKGWDGE 
EPVQAGALSV