Gene Strop_0568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0568
Symbol
ID	5057008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	638553
End bp	640511
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	67%
IMG OID	640472838
Product	DNA-cytosine methyltransferase
Protein accession	YP_001157427
Protein GI	145593130
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase [COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.905473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAAA ATACCGTCGA ACGGCGTCGG GCAGGCTACG GCGTCAAACT CGTACGTGGC 
CCGTTCGTAC GCCTGGCGCC ACACCCCGAG GCATGCGAGA ACGACGACGA GTTCCTCCGC 
TTCGCAAAAG CGTGCCGTGA GCGGGGCGAG CGGCTGGCAG CGGACCTGTT CAGCGGCGCG 
GGTGGTCTGA GCCTGGGTCT CACCGAGGCC GGTTTCCGTG TGGTCCTGGC GGCCGACCGC 
GACCCAGAGT CCGTCGAGAC ACATCGTCAT CACTACCCGG GCCTCACCCT CGACTACGAC 
CTGGGAGAGT CCGCCAACAT CCGGCGAATC GCCGCTCTGG TCAAGGAGGC GGGGATCGAG 
CTGCTGACCG GCGGCCCACC ATGCCAACCC TTCTCCCGAG CGGGCCGGTC ACTGATCCGT 
CACCAGGTCC GTCACGGTCT CCGCCCGGCA CATGACGAAC GCCGGGACCT CTGGCACTCG 
TTCCTGGAGG TCATTCAGCT GGCCACACCC GCCGCCGTGA TCATGGAAAA CGTCCCCGAC 
ATGGCACTCG ATCGGGAGAT GTTCATCCTC CGCACCATGG TGCACGAACT GGAGTCGATC 
GGTTACGCCG TCGAGGAACA GGTCGTCGAC ACCCTCCGTT ACGGCGTACC CCAGTTCCGC 
CAGCGATTGA TCCTGGTTGC ACTGCGAGAC GGAGTCGCCT TCGACTGGCC GCCGGAGGTA 
CCGGACCGGG TGTCGGTGTG GAACGCGATC GGCGACCTAC CCGAGGTCGA GGGCGGCTGG 
AGGCCCGAGG GTGGTGCCGA CGGCTGGTCA GACTACACCG GCCCCGCTTC CGCCTTTCAG 
AGGCAGATGC GTCAGGGTGT TGCACCGGTG GACACGGGCA AGGTCTTCGA CCACATCACC 
CGGCCCGTAC GCGAGGACGA CCAGCGCGCC TTCGACATGA TGGACGCCGG CACCCGATAC 
TCAGAACTGC CGGAGGACGT CAAGCGCTAC CGCGACGACA TCTTCGACGA CAAGTACAAG 
CGCCTGAGCG AGGACACCTA CTCCCGCACT ATCACCGCGC ACATCGCCAA GGATGGCTAC 
TGGTACATCC ATCCCCGACA GGACCGCACA CTGACGGTGC GTGAGGCCGC GCGGCTGCAG 
ACCTTCCCCG ACTGGTTCCG CTTCGCCGGC CCACCGTCGG CCGCGTTCCG TCAGATCGGC 
AACGCCGTAC CCCCGGCGCT GGGCACCCAG CTCGGACGCG CCGTGATGGC AGCGCTGGAC 
GCCCTCAGGC CAACTCCGTA CCGCAGCCGC GACATAGCCC ACGCCCTCGC CACCTGGTTC 
GACGACCTCA GCGAGCCGGC CCTCCCGTGG CTGCGCGCTC GGACACGGTG GCAGGTCATC 
TCCGCGGAGA TGCTTCTCGA CCGGACAGCA CCCGAGCAGG TTCGAATCCT CTGGTCACTG 
CTCGAACGAT GGGAGCAGCC ACAGGACACC GTCGACGCCG GCGACGAACT CGTCGAGATC 
GGGCGGTGGA TCAACCGCGA GCACCGCGCG GAGCGGCTGC TCGAACTGGC GCGCACGCTC 
ACCTCGCAAC CAGACCTGCT CGACGACTAC AAGATCCACA GCCTTCGCGG GGTCGACGCC 
TCGGTGATCG ACCTTGCTGT CCTCGCGATC CCAACCCGCG ACGAAGACAA CGCGGAGGAA 
CCCGTCCTCA TCACCAAGGG CACTCACCGC GTCGCCGCCC GCTTCACCGG CGAGCACGTC 
GAACGCAGCC ACAGAATGAC AGCAGGGCGT CTGGCCGTTG CCCGAATGAT CGGCGATGAC 
GCCGACGCGC GGCGAGCACA CCTCGGCCTG ATCGAGCTGG CCACCTCCGT CTGCCGCCCG 
ACCGACCCTG CCTGCCCACG CTGCCCCCTC AACAGGGCAT GCAGCGAGGC TGCCAAACGG 
GGCAGTCGGA TCGAACGGCA GCCGGTGGTC AGTCCCTGA

Protein sequence

MTENTVERRR AGYGVKLVRG PFVRLAPHPE ACENDDEFLR FAKACRERGE RLAADLFSGA 
GGLSLGLTEA GFRVVLAADR DPESVETHRH HYPGLTLDYD LGESANIRRI AALVKEAGIE 
LLTGGPPCQP FSRAGRSLIR HQVRHGLRPA HDERRDLWHS FLEVIQLATP AAVIMENVPD 
MALDREMFIL RTMVHELESI GYAVEEQVVD TLRYGVPQFR QRLILVALRD GVAFDWPPEV 
PDRVSVWNAI GDLPEVEGGW RPEGGADGWS DYTGPASAFQ RQMRQGVAPV DTGKVFDHIT 
RPVREDDQRA FDMMDAGTRY SELPEDVKRY RDDIFDDKYK RLSEDTYSRT ITAHIAKDGY 
WYIHPRQDRT LTVREAARLQ TFPDWFRFAG PPSAAFRQIG NAVPPALGTQ LGRAVMAALD 
ALRPTPYRSR DIAHALATWF DDLSEPALPW LRARTRWQVI SAEMLLDRTA PEQVRILWSL 
LERWEQPQDT VDAGDELVEI GRWINREHRA ERLLELARTL TSQPDLLDDY KIHSLRGVDA 
SVIDLAVLAI PTRDEDNAEE PVLITKGTHR VAARFTGEHV ERSHRMTAGR LAVARMIGDD 
ADARRAHLGL IELATSVCRP TDPACPRCPL NRACSEAAKR GSRIERQPVV SP