Gene Namu_1962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1962
Symbol
ID	8447571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2162370
End bp	2163773
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	55%
IMG OID	645041093
Product	DNA-cytosine methyltransferase
Protein accession	YP_003201339
Protein GI	258652183
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0166825
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGAGG CTGAGTACAG CTTCCGCTTC GTCGACCTCT TTGCAGGTTT AGGGGGCTTT 
CACGTGGCGC TGCGAGAACT CGGAGGAGCG TGCGTGTTTG CTGCCGAGTT GGACCCAACC 
CTTAATGCGC TCTACGCGGA GAACTATCAA CTCGAGGCTT GGAAGGATAT AAATGACCTC 
GCATCTTCAC GAATCATATC ACAGGAAGTT CCGGACCATG ACGTTCTGAC AGCGGGATTT 
CCCTGTCAAC CGTTCTCGAA AGCGGGGGAA CAACTGGGAT TCAAGGACAC GACACAGGGC 
CATCTCTTTT TCAAGGTAAT CCAGATCTTG CAGACAAAGA AGCCCAGACA TTTCCTGCTT 
GAGAATGTTC CAAACATTCT CAAGCATTCC GGCGGTGGGA CCCTTCAAAC AATACTGGCA 
GAGTTAGAAG CAATCGGCTA CTCGGTCGGG GTTCGTCGCT TATCGCCCCA CGAGTTCGGA 
ATACCTCAAA TTCGAGACCG GGCGTACTTC GTGGGGTCCC GCGATGGCCT TGAACAATTT 
CGTTGGCCTG AGACCGAAAA GAGCAGCACT GACATAAAAT CAGTGCTGAA GCACGATCTC 
GTCGATGTGC GGCCCATCCC CGCACAGACT ACACATGCGA TTAACATGTG GGATGACTTT 
CTCAAACGTT CTCCAGCGAG GGTGAAGCTT CCATGGTTCC CAATCTGGGC GATGGAGTTT 
CGAGCGACGT ACCCCTTTGA AGAGGCCACC CCATCCGCGA TATGGGCTGA AAAGGGAAGT 
CGTGGTTTGA GTCGGCATCT AGGAAGCTTC GGATTTGAAT TGAGAGGCCT CGACCGTGCC 
GCTCAATTCG AGCGCCTTCC AAGTCATGCC CGTCGCGCAG ACGACTTCAA GTTTCCCGAC 
TGGAAGAAAG ACTTCATTCG ACAGAACCGT GAATTCTATT GCGAGAACCG GAAATGGATC 
GATCCTTGGC TCGCGAAGTG GGAACCTTGG CGCATGGTCT CAAGCTACCA GAAGTTCGAG 
TGGAATGCCC AGGGTGCGGA ACGTAAGATC GACAAGCACG TGATTCAGGT TCGCGCATCC 
GGGCTACGTG TAAAGCGCAC GACGACAGCG CCAAGTCTAA TTGCCATGAC TAACACCCAG 
GTTCCAATAC TTGGCAGGCA CCTAGTCGGC GTTAGGCGGT ATATGACGCC GCAGGAATGT 
GCCGAACTCC AGTGCCTAGG AGATATCGAG TTGCCGAGGA ACGATCTCCA AGCATATAAG 
GCCTTGGGGA ATGCCGTCAA CGCCCGGGTA GTGAAGGCGA TCGCAGAACC GTTGCTGGGC 
GAGCTGACGC GCGCGGGCGG TGCACGCATA CCCGTGCCAA AGTCGCGACG CAAAGCAATT 
GGCGGTAGCG TACCGTCTCA CTAG

Protein sequence

MSEAEYSFRF VDLFAGLGGF HVALRELGGA CVFAAELDPT LNALYAENYQ LEAWKDINDL 
ASSRIISQEV PDHDVLTAGF PCQPFSKAGE QLGFKDTTQG HLFFKVIQIL QTKKPRHFLL 
ENVPNILKHS GGGTLQTILA ELEAIGYSVG VRRLSPHEFG IPQIRDRAYF VGSRDGLEQF 
RWPETEKSST DIKSVLKHDL VDVRPIPAQT THAINMWDDF LKRSPARVKL PWFPIWAMEF 
RATYPFEEAT PSAIWAEKGS RGLSRHLGSF GFELRGLDRA AQFERLPSHA RRADDFKFPD 
WKKDFIRQNR EFYCENRKWI DPWLAKWEPW RMVSSYQKFE WNAQGAERKI DKHVIQVRAS 
GLRVKRTTTA PSLIAMTNTQ VPILGRHLVG VRRYMTPQEC AELQCLGDIE LPRNDLQAYK 
ALGNAVNARV VKAIAEPLLG ELTRAGGARI PVPKSRRKAI GGSVPSH