Gene Rcas_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1389
Symbol
ID	5538862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1775718
End bp	1776881
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	60%
IMG OID	640893527
Product	DNA-cytosine methyltransferase
Protein accession	YP_001431503
Protein GI	156741374
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.376971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCC TGACCTTCTA CGAATTCTTC GCCGGCGGCG GCCTGGCACG GATTGGACTG 
GGACCACAGT GGACCTGCCT GTTCGCCAAT GACATCGACC CCAAAAAAGC GGACGTGTAC 
CGGCGTAACT TCTCCGGCGC GCCAGAGCTG GTTGTTGCGG ATATCCATCG TGTGACGACG 
GATATGCTTC CGGGTCGCGC GCTATTGGCA TGGGCGTCGT TCCCCTGTCA GGATCTGTCG 
CTCGCGGGGA AAGGCGGCGG GTTGCGCGCC GAACGCAGCG GCACATTCTG GTCATTCTGG 
AATCTCGTGA CCACGCTCGA CCGGGAAGGG AGACCGGCGC CGATCATTGC CATTGAAAAT 
GTTGTCGGTT TGCTTACCTC AAATCGAGGA CGCGATTTTC AGGAACTGGT CTCGGTTATT 
GTTGCACAAG GATACCGCCT GGGCGCCATG GTCATTGACG CCGTGCATTT CGTTCCTCAA 
TCGCGACCAC GGCTCTTCAT CGTTGCAGTC AAGGACGACG TGACGATACC AGAGATGGTG 
ATCACGCCCA CGCCGCACGC AACGTGGCAT CCGGCAGCGG TCGTTCGCGC CTTCCGTCAT 
CTCGCGCCAT TGGCGCAAGA TGCATGGGTC TGGTGGAGTC TCCCCTTGCC ACAACGAACG 
CCACGCCGTA TTCACGATGT GATCGATCCT GAGCCAACCG GCGTTTCCTG GCATCGCCCC 
GAAGAAACAC AACGCCTCCT GTCACTGATG TCTCCGCTCA ATCTCGCCAA GGTGCGTCAC 
GCGCAGTTGA CCGGTCGTCT CCACATCGGC GCCATCTACA AGCGCACGCG CCTTCAGAAC 
GGAGCCAAGC GCCAGCGCGC AGAAGTGCGG TTCGATGGCA TCAGCGGTTG TCTGCGGACA 
CCGGCTGGAG GTTCGAGCCG ACAGACGATT CTGGTCGTCG AAGGGGATGT CATCCGCTCA 
CGGCTGCTTT CGGTACGCGA AGCGGCGCGC TTAATGGGCT TGCCCGACCG ATACTGGTTG 
CCTGGACGCT ACAATGACGG GTATTATGTC ATGGGCGACG CGGTCGTCGT GCCCGTCGTT 
TCGTGGCTGG AGGAGCATAT CCTTCGTCCG ATTGCAACAT CTATCGTGCA GAATGAGGAG 
TCCCTGGCGT ATGTCAGCCC GTGA

Protein sequence

MTGLTFYEFF AGGGLARIGL GPQWTCLFAN DIDPKKADVY RRNFSGAPEL VVADIHRVTT 
DMLPGRALLA WASFPCQDLS LAGKGGGLRA ERSGTFWSFW NLVTTLDREG RPAPIIAIEN 
VVGLLTSNRG RDFQELVSVI VAQGYRLGAM VIDAVHFVPQ SRPRLFIVAV KDDVTIPEMV 
ITPTPHATWH PAAVVRAFRH LAPLAQDAWV WWSLPLPQRT PRRIHDVIDP EPTGVSWHRP 
EETQRLLSLM SPLNLAKVRH AQLTGRLHIG AIYKRTRLQN GAKRQRAEVR FDGISGCLRT 
PAGGSSRQTI LVVEGDVIRS RLLSVREAAR LMGLPDRYWL PGRYNDGYYV MGDAVVVPVV 
SWLEEHILRP IATSIVQNEE SLAYVSP