Gene Rcas_3593 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3593
Symbol
ID	5541094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4689215
End bp	4690333
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	64%
IMG OID	640895712
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_001433660
Protein GI	156743531
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.316349
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGTC CGCTTCTTCC GAACCGTTCG CCTGCTGAGC GCGCCATTCC CGATGACGTG 
CTGCGCCTGG CACGCACCCG CTTCACGCAT GCGCTCGCTC GACTGCGCGA ATCTGCCTCG 
ATTGCCGAGT TGCGCACCGC GCTGGATGCG CTCTGGCGCG AGATCGATGA CCCGTCCGGT 
GCGTTGCTCG TCGCTGCCGA TGATGCGGAG ACCACCGCCT TCAGCAAACG GCGGTTACGC 
GACGCATTCG AGCAGATTGC GCGCGCCTAC ACCCTCGAAC GCGCCCGCTA CTATCTCGAC 
CGTCTGGCGC GCGCCGCGGG TGAGTCCCGT ACCGGCGCGA TCAACGAGAT CGACCTCAAC 
CGCTGGAAAG AATACGACGA TGTTTTGACC GATAGTTTAT GGCTGTTTGA CCGGCGCGCC 
GCCGGCGGCG CGCACCATGC GGGGTTCTGG GGCAATTTTG TGCCGCAGAT CCCCTATCAA 
CTGATGCTGC GGTATACCCG TCGCGGCGAC CTGGTCCTCG ACCCGTTCGC CGGTTCCGGT 
ACCACGCTGA TCGAAGCGCA GCGTCTGGGT CGATTGGCGA TTGGCGTGGA ACTGAACCCG 
GCCGTGGCGC AACAGACGCG CGCGACGCTG GCGCGCGAAT CCGACGTTCG TTCGGCGCTG 
TGCGCGCTTG AGGTCGGCGA TAGCGCCGCC TTCGATTGGC GCGCGACGCT GGAACGCTAT 
GGCGTTCGCT CGGCGCAACT TGCCATTCTG CATCCGCCGT ACCACGACAT CATTCGCTTC 
AGCGACGACC CGCGCGACCT GGCGAATGCG CCGTCGGTCG ACGCCTTTCT GTCGCGTCTT 
GGCGCGGTCG TGGCGCAGGT TAAAGCGGCG CTCGACGCCG GACGCTACCT GGCGCTGGTG 
CTCGGCGACA AATATGCCAA CGGCGAGTGG GTCCCGCTCG GATTTCTTGG CATGCAGGAA 
GTGCTGCGCC ACGGATTCAC CCTCAAGAGC ATTGTCGTCA AGAACTTCGA GCAAACGACC 
GGGAAGCGCG GTCAGCACGA ACTCTGGCGC TATCGCGCGC TGGTTGGCGG ATTCTATGTC 
TTCAAGCATG AGTACATTTT CATCTTCCGG AACGCCTGA

Protein sequence

MARPLLPNRS PAERAIPDDV LRLARTRFTH ALARLRESAS IAELRTALDA LWREIDDPSG 
ALLVAADDAE TTAFSKRRLR DAFEQIARAY TLERARYYLD RLARAAGESR TGAINEIDLN 
RWKEYDDVLT DSLWLFDRRA AGGAHHAGFW GNFVPQIPYQ LMLRYTRRGD LVLDPFAGSG 
TTLIEAQRLG RLAIGVELNP AVAQQTRATL ARESDVRSAL CALEVGDSAA FDWRATLERY 
GVRSAQLAIL HPPYHDIIRF SDDPRDLANA PSVDAFLSRL GAVVAQVKAA LDAGRYLALV 
LGDKYANGEW VPLGFLGMQE VLRHGFTLKS IVVKNFEQTT GKRGQHELWR YRALVGGFYV 
FKHEYIFIFR NA