Gene Rcas_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0474
Symbol
ID	5537937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	613696
End bp	614790
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	61%
IMG OID	640892636
Product	restriction endonuclease
Protein accession	YP_001430622
Protein GI	156740493
COG category	[V] Defense mechanisms
COG ID	[COG1715] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.674991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACGTC GTCGCTCTCG CCGCTCATCG GATGCCGGAA GCGCTGTGAG TATTCTGCTC 
GTCGCCCCGG TATGCGCCGG GTTTTTCTGG CAATCATGGA CGCAACTCGC ACTCGCCTGG 
CAGGTCGCTG CCGTCGTGCT GGCGTGTTCA ATCCTGTTTC TGCTGTTTCT GTTCTTCATT 
GATCTGTTCC GCGCTCTTCG TCAGCGCGCT CTGCTGCAGA AAGCATTGTT GGCGCTGACG 
CCTTCAGAAT TTGAGGAACG GGTGCTGCTG CTCCTAAAGG ATCTCGGATG GACCAATCTT 
CGACTGCGTG GCGGCAGCGG CGACCGAGGG GTCGATCTCG AAGGCGAGTT CCAGGGACAA 
CGCTATATTG TCCAGTGCAA ACGACACACC AAAGCAGTGC CGCCTTCGAT GGTGCGCGAT 
CTGGCGGGCG CTTTGCATAT TCAGCGCGCT GATCGTGCGT TGCTGGTGAC CACAAGTTCT 
TTTACACGGC AAGGGTACGA AGAGGCTTGT AATCAGCCGA TTGAATTATG GGACGGCGAC 
ATCCTGGCGC GCAAGATCAA AGAAGCCGAT GCGTTACGCG CGAACCCGGC GCACCGGCGC 
AATGCCTGGC GAGGTCGGGT TGCGGTGTTG GCGACATTCG CTGTGGCGAA CGCATCGTGT 
GTGCTGTTCG CATTCGTCAG CGCCGGCGCG CCGGCGCTGA CGGCGCCCGC CGCGCGAACA 
AGCGGCGCTC CATCGCACAC AAACGTCACC AATCCGACGG CGATCCCCGT ACAAACGGAT 
ATTCCCCCCG CCTCTCCGAC GGCGATCCCC GTACAAACGG ATATTCCCCC CGCCTCTCCA 
GCGCCGACGC CAACCGAGCG CCCGGTCCTG ACAACAACCG TCTTCAACGG CGGGAATGTG 
CGCGCAGCGC CCAACCTTCG AGGGGCGGTG CTCGATCAGG TCCATGCGGG AGAAATCGTC 
GAACTGCTTG GTCGCTCCCC CGACGGAAAC TGGTTCTACA TTCGCAACCC GCGCAATCAG 
GTCGGATGGA CGCATCGCAC GTTGCTGAAC CTCGACGCAG GCGTGGATGA TCGCCTGGAT 
GTGCTGCGAC CTTGA

Protein sequence

MSRRRSRRSS DAGSAVSILL VAPVCAGFFW QSWTQLALAW QVAAVVLACS ILFLLFLFFI 
DLFRALRQRA LLQKALLALT PSEFEERVLL LLKDLGWTNL RLRGGSGDRG VDLEGEFQGQ 
RYIVQCKRHT KAVPPSMVRD LAGALHIQRA DRALLVTTSS FTRQGYEEAC NQPIELWDGD 
ILARKIKEAD ALRANPAHRR NAWRGRVAVL ATFAVANASC VLFAFVSAGA PALTAPAART 
SGAPSHTNVT NPTAIPVQTD IPPASPTAIP VQTDIPPASP APTPTERPVL TTTVFNGGNV 
RAAPNLRGAV LDQVHAGEIV ELLGRSPDGN WFYIRNPRNQ VGWTHRTLLN LDAGVDDRLD 
VLRP