Gene Noca_2284 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2284
Symbol
ID	4595832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2433741
End bp	2434940
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	65%
IMG OID	639776883
Product	DNA-cytosine methyltransferase
Protein accession	YP_923476
Protein GI	119716511
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCCACG ACGCTCCGGA GGCAGCAGAC GACGCCGACT CTGGCTCTTG CATCGAACTC 
TTTTCCGGTG GTGGTGGCCT CGCGATGGCA CTGCACGAGG CTGGCTTTCG CCACCTTCTG 
CTCAACGAGC TGAACAAGCG TGCTTGCGCG ACCCTCAGGG CCAACAACGC CGTGGACTAC 
CTGCCCGACG AGACACCTCC CGCGACGCTC GCCGACCCGT GGCCCCTCAT CGAAGGAGGG 
ATTGGGGAAG TCGACTTCAC GCCGTTCCTC GGAGACGTCG ATGTCGTCGC TGGCGGCGTA 
CCTTGCCAGC CGTTCAGCCT TGGCGGGGCC CACAAGGGTC ACCTCGACGA ACGCAACCTG 
TGGCCTGAGT TCAACCGTTG TGTCCGGGAA ACACGACCAC TGGTCATCCT CGCCGAGAAC 
GTGCGGGGCC TCCTCCGGCC CTCCTTCGAG CCCTATTGGG ATTACATCCG CCGAGAACTG 
GCTGCCCCAT TCGAGCAACG CGTCGACGGG GAACCATGGG CCGATCATGA CCGCCGTCTG 
GTCAAGGCGT TGCGCGGTGG CGGCGGCGAT CCCACCGAGC GATACGACAT CGCGTTCAAG 
CTGGTCAACG CCGCCGACTA CGGCGTTCCG CAGAATCGAT GGCGAGTTGT GCTGGTCGGT 
TTCCGCAAGG ATCTAGGGAT CTCGTGGAGC TTCCCCGACC CCACGCACAG TGCCGGCGCT 
CTTCTGCGCG CCCAACTGTC CGGAGAGTAC TCAGATCGGC ATCCCCACGC GCCGATCAAA 
GAGCATCCCG GCGTCACGCC ACCGGAGGAC GGTCTACGGC CATGGAAGAC CCTGAGGGAC 
GCCATCCACG ACCTGCCCGA ACCGGTAGAG CGACAGGACA CGCCGGGCTA CATCCACCAC 
ATCGGCTGGC CAGGCGCTCG TGAGTACCCC GGGCACACCG CCAACGTGCT CGACAGGCCG 
GCCAAGACCG TCAAGGCAGG CGTACACGGC GTTCCTGGCG GTGAGTCGGT TCTCCGGCGT 
GATGACGGGA GCATCCGCTA CCTGACTGTT CGCGAAGTCG CGCGCATCAT GACGTTCCCT 
GACGATTGGC GGCTCGAGGG TCCGCGGGGC GAGCAAATGC GCCAACTCGG GAATGCCGTC 
CCCGTCCGTC TCGGTGCAGT GATGGGTCGC GAGATCGCGA AGGTTCTGCG GGAACGATGA

Protein sequence

MVHDAPEAAD DADSGSCIEL FSGGGGLAMA LHEAGFRHLL LNELNKRACA TLRANNAVDY 
LPDETPPATL ADPWPLIEGG IGEVDFTPFL GDVDVVAGGV PCQPFSLGGA HKGHLDERNL 
WPEFNRCVRE TRPLVILAEN VRGLLRPSFE PYWDYIRREL AAPFEQRVDG EPWADHDRRL 
VKALRGGGGD PTERYDIAFK LVNAADYGVP QNRWRVVLVG FRKDLGISWS FPDPTHSAGA 
LLRAQLSGEY SDRHPHAPIK EHPGVTPPED GLRPWKTLRD AIHDLPEPVE RQDTPGYIHH 
IGWPGAREYP GHTANVLDRP AKTVKAGVHG VPGGESVLRR DDGSIRYLTV REVARIMTFP 
DDWRLEGPRG EQMRQLGNAV PVRLGAVMGR EIAKVLRER