Gene Rcas_4183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4183
Symbol
ID	5541694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5413189
End bp	5414301
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	52%
IMG OID	640896293
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_001434231
Protein GI	156744102
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.712653
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00000333681
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGCAG CCACAAAGCC GCAAGCATTC GTTACACCCG ATCAGTGGCG ATCAACGATT 
GTCGAGACTC ATCACCGCGC CAGGGTTGAC GCCTATCTGT GCGACACACG GCTGCAACCG 
CTCCTGCTGC TCGGCGACGC GCAGACCGTT TTGGAGCAAT TGCCAGAAGC GAGTATCGAT 
ATGGTGATGA CCTCTCCTCC GTACTGGGGG AAGCGTGAAT ACGACGATGG CGGTATTGGG 
ATGGAGGATG ACCATCGTGA GTACATCCGT CATCTCACAC AGATATGTTC TCTCATCAAG 
CGGGTGCTGA AACCTGAAGG ATCATTCTGG CTCAACCTTG GCGATACCTA TCATCATATG 
CACCTGCTCG GCATTCCCTG GCGTGTGGCG CTCGCACTGA CCGATCATCA GGGATGGATC 
TTGCGCAATA GTGTGATCTG GAATAAGGTC AAAAGTGGTA TGGATACCGC AAAGAACCGA 
TTAGGAAATG TTCATGAATA TCTGTTTCAT TTTGTGAAAC AACCGAAATA CTACTACAAC 
GTCGACGCAA TTCGCTCAAA ACCACGGCAA TCCCGAGTTG TGAACGGCTC GGTCATATCG 
GCGACAGGAG TTTCTGGGGT GCGTTATCGC CGTCAGATCG AACTTTCAAC CGCTCTTTCT 
AACGAAGAGA AGCAGGAAGC GCTCAGGGAA TTGAACAAAA TGCTGGAAGA TGTCGCTGCC 
GGTAAAATAT CCGATTTCCG GATGATCATT CGCGGACAGC AGAGGGCTAC CCATTCCGAT 
CGCGAGCGTG TGTCGGGACG AGCGCGTGAG CTGAAGGAGA AAGGATTCTA TTTTTTACGC 
TACCATCCTC ACGGCAGCAA GCCCGGGGAT GTGTGGGACA TTCTCCCTGA GGATACGCAA 
CGGCGAGATG TGCATTTTGC ACCGTATCCT GTCGATCTCT GTCGAATCCC TATCCTGTCC 
ACCTGTCCAG AATATGGCGT GGTTCTTGAC CCGTTTTGCG GAACAGGAAC CACACTCCTG 
GCGGCGCGTG ATCTGGGGCG GAGATCGATA GGTATTGATA TTTCGCAGAG CTATCTCGAA 
ATAGCATTGC AACGGTGTCA AACATTGTTA TGA

Protein sequence

MDAATKPQAF VTPDQWRSTI VETHHRARVD AYLCDTRLQP LLLLGDAQTV LEQLPEASID 
MVMTSPPYWG KREYDDGGIG MEDDHREYIR HLTQICSLIK RVLKPEGSFW LNLGDTYHHM 
HLLGIPWRVA LALTDHQGWI LRNSVIWNKV KSGMDTAKNR LGNVHEYLFH FVKQPKYYYN 
VDAIRSKPRQ SRVVNGSVIS ATGVSGVRYR RQIELSTALS NEEKQEALRE LNKMLEDVAA 
GKISDFRMII RGQQRATHSD RERVSGRARE LKEKGFYFLR YHPHGSKPGD VWDILPEDTQ 
RRDVHFAPYP VDLCRIPILS TCPEYGVVLD PFCGTGTTLL AARDLGRRSI GIDISQSYLE 
IALQRCQTLL