Gene RoseRS_4184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4184
Symbol
ID	5211168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5240126
End bp	5241178
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	47%
IMG OID	640597773
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_001278478
Protein GI	148658273
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0040014
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000116244
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCGTC ACCATCCACC TATCCCTGTT GAAATCGAAC GGCTTCCCAA ACATTTACAA 
CCGACATTTC TCAAACTCTA TAGCGCAGAT CATCCAGAAA ATGGCGGCAT GTATTTCCTT 
GAGCCAGACA ACATCTACTG TGGCGATGCC CGCCAACTTT TGCCCCAAAT AGAGCCGAAC 
AGCATTGCCT TGAGTGTATG GTCGCCGCCA TACTTCGTCG GGAAAGAGTA TGAAGAGCAT 
CTTTCCTTCG ATGAGTGGAA AGATCTTCTT CGTACTGTGA TACATTTACA CTTTCCAATT 
ATCAAGCCCG GTGGTTTTCT GGTCATCAAC ATTGCAGATA TACTGGTGTT TAAGGATCCC 
CACATGCCTC GCATCCAGGC AGAGGCAGTC AACAGGAAGC GATCTCCCGT TACCAGGGAA 
GATATTCTGC GAGCAATTGA ACAACACCCT GACTTTAATC GTTATCAGCT CGCAGAACTT 
TTAGGTTGCA GCGAGCAGAC AATAGACAGA CGACTCAACG GCAACAATAT CCGCGGCGGT 
AAATATGACA TCCAAACCCG GGTCAAGATC GTGGGGGGTC TTGTTGAAGA ATGGGCGCTG 
GATGCAGGCT TTTTCACTTA CGACCGGCGG ATATGGGTCA AGGATGCCGC ATGGGAAAAC 
TCTCGCTGGG CAAGTCTTTC CTATCGCTCT GTTGACGAGT TTGAATATAT TTTCTTTTTC 
TGGAAACCTG GTGTTACTAA GTTTGACCGG AGAAGATTAT CTTCTGATGA ATGGCGAGAT 
TGGGGATCGA GAGGAGTATG GCGCATTCCC TCGGTCCGGT CAAACGATGA TCACGAGGCA 
AAATTTCCGG TCGAATTGCC TTCCAGAGCC ATCAAACTTC TTACCGATCC GGGTGATATT 
GTGCTGGATT GTTTTATTGG AAGCGGTACA ACAGCAATAG CAGCGATCCG TGCTGGTCGT 
CGGTATATAG GCATCGATAT TCTCCAGAAG TATGTTGATC TGGCAAGAAA TAATATCAGG 
AGGGAGTTAC AGCAAATTAG TATGGAGATA TAA

Protein sequence

MNRHHPPIPV EIERLPKHLQ PTFLKLYSAD HPENGGMYFL EPDNIYCGDA RQLLPQIEPN 
SIALSVWSPP YFVGKEYEEH LSFDEWKDLL RTVIHLHFPI IKPGGFLVIN IADILVFKDP 
HMPRIQAEAV NRKRSPVTRE DILRAIEQHP DFNRYQLAEL LGCSEQTIDR RLNGNNIRGG 
KYDIQTRVKI VGGLVEEWAL DAGFFTYDRR IWVKDAAWEN SRWASLSYRS VDEFEYIFFF 
WKPGVTKFDR RRLSSDEWRD WGSRGVWRIP SVRSNDDHEA KFPVELPSRA IKLLTDPGDI 
VLDCFIGSGT TAIAAIRAGR RYIGIDILQK YVDLARNNIR RELQQISMEI