Gene RoseRS_1865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1865
Symbol
ID	5208825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	2307164
End bp	2308657
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	56%
IMG OID	640595473
Product	CRISPR-associated Cst1 family protein
Protein accession	YP_001276204
Protein GI	148655999
COG category
COG ID
TIGRFAM ID	[TIGR01908] CRISPR-associated CXXC_CXXC protein Cst1

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.858378
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACCT ATACCGGACA TCCATTCGTC GATACGGGGT TTGCCGTGAT CACCGCTTTT 
GTGCGTAAAC GGCGCTTTGC CGATCTCGCC GACGACGATT TTCAGCAGAT CGCCGACTAT 
ATCGAAGCGA ACTATGTGCG ACAGCCCCTG CGCAGCTTTT TGACCGTGGC GTTTACCAGT 
AATGCATGGT TCGCGCAATC GGCGTTCAAT CCCGACCGGC CCGACCTGTC GCCGGAAAAA 
CAGACTGAAG CGCGTGAGAA GCGCCAGTAC TGGGCGGATC GGCATTTGCG CCAGTGGCAG 
CAGAGCGCTG CTGCGCTCGA AACCTGCCTT TTCACCGGAT TACCGGCGGC AGGTCTTGAA 
TTGTCGCAGA AGTTGCAACC GGGACGGGTA GGGCGGGCGC AAATGCCATT GCTTCAGGGT 
GATGATGCGA TCAACTTCTT TATCAATGGC GACCCTGGTT TGCCGATGGC GGCGGAAGCG 
ATTCTGGCAC TCCAGGCGAT GCCTCTGGGA TGCGCTAAAG TCGGTGGGGG CTTGCTCGCC 
GTGCACTGCG ATGATGAGGC GTTGACGATC GCCTTCGCAA CACGCTTCTT GCAGCGCAAT 
CTCAACGATG TGGCGAAAGC GCAGGCTGCC GGCGAAAAGA AACTGCCCGG TTCGCCGCGC 
AGTCTGAAGA CGCTGCTGGT TGAGACATTG ACCGAGATTC TGATTCGGCA GATTCAGGAA 
GAGGAGCGAC GCGCACGGCG TCCGGCGATC ACGGCCTACT ATTTCAACAA TGGTCAGTCG 
CCGTTTCTTG AAATCTACCA TCTGCCGCTC CAGATTACCG GTTTTCTCCT GGCAGTGCAT 
ACCCCTGCCT ACCGCGCGAT CTGGAATGAA CTGGTGCAAC GTGGCTGGCA GCGCGCAGGA 
ATATCAGGCA AGCAGGGGAA GGCAGTCGAT CCGGTTGAAC CACATTTCAA CTATCTGTAC 
GAAGACCTTT TTACCCTGCC GGCGCAGGCG GCGCGGTTCG TGCGCACCTA TTTTCTGCGC 
ATTCCCGATC TTCGTCGCTC AGCGGACGAT CCGCGGCGCG AGTATTCGCC GCGCCGCGAA 
GCCGATCTGG TTTCATGGCC GCTCGTTGAA CTCTTTGCAC AGGAGGTATT GCTCATGACC 
GATGACCGGG TAACGAAATT GAAGGAGTTG GGCGATAAAC TGGCTGATTA CACCCGTTAT 
CAGGGAGGTA AGCGTTTTTT TCGCCAGTTC TTTGTCGAGC AGCGAAGTGA TAACTTTCTC 
AGCCTGCTGA ACAAAGCCAA TATCGACTAC ACGCGCTACA AGCGTGGTCA GGAGACATTG 
TTCGATCTCG ATAGTTTTCT GACCATTTTT ATGGAGGGCG ATGAGGTCTT GCGCAAGGAC 
TGGCGCCTGA TGCGAGATCT GGTGCTCATT CGTATGGTCG AACAGTTGCG CGACTGGATC 
GCCGGCAACC CTGATGCCAT TCCAGCCGAA GAAGAAGTTG CAGCAAACGA ATAG

Protein sequence

MITYTGHPFV DTGFAVITAF VRKRRFADLA DDDFQQIADY IEANYVRQPL RSFLTVAFTS 
NAWFAQSAFN PDRPDLSPEK QTEAREKRQY WADRHLRQWQ QSAAALETCL FTGLPAAGLE 
LSQKLQPGRV GRAQMPLLQG DDAINFFING DPGLPMAAEA ILALQAMPLG CAKVGGGLLA 
VHCDDEALTI AFATRFLQRN LNDVAKAQAA GEKKLPGSPR SLKTLLVETL TEILIRQIQE 
EERRARRPAI TAYYFNNGQS PFLEIYHLPL QITGFLLAVH TPAYRAIWNE LVQRGWQRAG 
ISGKQGKAVD PVEPHFNYLY EDLFTLPAQA ARFVRTYFLR IPDLRRSADD PRREYSPRRE 
ADLVSWPLVE LFAQEVLLMT DDRVTKLKEL GDKLADYTRY QGGKRFFRQF FVEQRSDNFL 
SLLNKANIDY TRYKRGQETL FDLDSFLTIF MEGDEVLRKD WRLMRDLVLI RMVEQLRDWI 
AGNPDAIPAE EEVAANE