Gene Saro_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1840
Symbol
ID	3918400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1939534
End bp	1940676
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	63%
IMG OID	640444582
Product	DNA methylase N-4/N-6
Protein accession	YP_497114
Protein GI	87199857
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0373756
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTTG CAACCAAGGA ACGCGCTAAG GCTCTTCGCG CGGCACCGGC AAAGGTGCTG 
AAGGCAGACA TCGCGCTGCC CGTGAACCAG ATCCTGCGCG GCGATTGCAT TGCCGAGATG 
CGCAAGCTGC CCGACGCCTC CATCGACATG ATCTTCGCCG ATCCGCCCTA CAACCTCCAG 
CTTGGCGGCG ATCTGGCTCG TCCCGATGGC AGCCATGTGG ACGCCGTCAC CAACGATTGG 
GACAAGTTCT CGAGCTTTGC CGCCTACGAC AAGTTCACGC GCGAATGGCT GGTCGAGGCG 
CGCCGCCTGC TGAAGCCGGA TGGTTCGATC TGGGTGATCG GCAGCTACCA CAACATCTTC 
CGCGTGGGTG CGCTGCTGCA GGATCTGGGG TTCTGGATTC TCAACGACAT CATCTGGCGC 
AAGGCCAACC CGATGCCCAA TTTCAAGGGC ACCCGCTTCA CCAACGCGCA CGAAACGCTG 
ATCTGGGCGT CGAAGAGCGA GAAGTCGAAG TACACCTTCA ACTATCGCGC GATGAAGACC 
CTGAACGACG AATTGCAGAT GCGCTCCGAC TGGGTTCTGC CGATCTGTTC GGGGCCGGAG 
CGCCTGCGCC GCAACGGCAC CAAGGCGCAC CCGACGCAGA AGCCAGAGGC GCTGCTCTAT 
CGCGTGATGC TTGCGACGAC CAACAAGGGC GACGTCGTGC TGGACCCGTT TTTCGGCACT 
GGCACCACCG GCGCGGTGGC CAAGCGGCTT GGCCGCAACT GGATCGGCTG CGAACGCGAG 
GATGACTACA TCGAGGTCGC CAACGAGCGC ATCGAACTGG CGCTGCCGCT TGACGAAAGC 
GCGCTGACGA CGATGCAGTC GAAGCGTAGC GCGCCCAAGG TGGCGTTCGG CGCACTGGTC 
GAAAGCGGTT ATCTGGCTCC CGGCACGCGG CTCACGGCCA AGAAGGGGCG GTTCAATGCG 
GTCGTTCGCG CCGACGGGTC GCTTCAGTCC GAAGCCGAGA TCGGTTCGAT CCACGGGCTC 
GGGGCAAAGC TCCAGGGTGC GCCTTCGTGC AATGGCTGGA CGTTCTGGCA TGTCGAGCAC 
GAAGGCGAGG TGAAGCCGAT CGACGCTCTG CGCCAGCTCT ACCTGCTCGC CGTGGAAGAT 
TGA

Protein sequence

MAVATKERAK ALRAAPAKVL KADIALPVNQ ILRGDCIAEM RKLPDASIDM IFADPPYNLQ 
LGGDLARPDG SHVDAVTNDW DKFSSFAAYD KFTREWLVEA RRLLKPDGSI WVIGSYHNIF 
RVGALLQDLG FWILNDIIWR KANPMPNFKG TRFTNAHETL IWASKSEKSK YTFNYRAMKT 
LNDELQMRSD WVLPICSGPE RLRRNGTKAH PTQKPEALLY RVMLATTNKG DVVLDPFFGT 
GTTGAVAKRL GRNWIGCERE DDYIEVANER IELALPLDES ALTTMQSKRS APKVAFGALV 
ESGYLAPGTR LTAKKGRFNA VVRADGSLQS EAEIGSIHGL GAKLQGAPSC NGWTFWHVEH 
EGEVKPIDAL RQLYLLAVED