Gene Rcas_3298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3298
Symbol
ID	5540796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4287700
End bp	4289205
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	58%
IMG OID	640895416
Product	CRISPR-associated Cst1 family protein
Protein accession	YP_001433367
Protein GI	156743238
COG category
COG ID
TIGRFAM ID	[TIGR01908] CRISPR-associated CXXC_CXXC protein Cst1

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.696898
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAACC CGATAGCGTA CACCGGCCAT CCCTTCATCG ATGTCGGCTT TGCCACGATG 
TGCGCTTTGA CCTGCAAGCG TCGCTTTGCC GATCTGACAG CAGATGATTT TCAAAAGGTC 
GTCGATTATA TCGAGACCAA CTACGTGCGC CAGCCGTTGC GCAGTTTTCT AACGGTGGCG 
TTCACCAGCA ATGCATGGTT CGCCCAATCG GCGTTCAACC CTGATCGGTT TGATGACCCT 
AACAAGAAGA ACGAAGCGCA GCAGAAACGC ACGTATTGGG CGGATCGACA CCTGCGCCAG 
TGGGCGCAGG CTGCTGAGTC GCTCGAAACC TGCCTCTTCA CCGGACTTCC GGCAGCGGCG 
CTCGAGTTGT CGGGCAAACT GCAACCAGGT CGGGTTGGGC GGGCGCAAAT GCCCCTGTTG 
CAGGGTGATG ACTCGATCAA CTTCTTCACC AACGGAGATC CAGGATTGCC GATGGCGCCG 
GAGGCGATTC TGGCGCTCCA GGCGATGCCG TTGGGCTGCG CCAAGGTTGG CGGCGGGCTG 
CTGGCGGTGC ACTGTGATGA TGAAGCATTG ACAATTGAGT TTGCCGGGCA GTTTTTGCAG 
CGTAATCTCG CCGATGTCAC CAAAGCGCAG GCAGCCGGTG AAGAGAAGCT GCCCGGATCA 
CCGCGTAGCT TGAAGACGTT GTTGATCGAA ACGCTCAATG CCATTCAAAC GCGGCAGGCG 
CAGGAGGAGT GGCGGCGCCA ACACCGGCCG GCCATCACGG CCTACTATTT CAACAATAGT 
CAATCGCCCT CGCTCGAAAT CTACTACTTG CCATTACAGA TCACCGGTTT TCTGAGCGCT 
GTTCACACTC CCACGTATCG CGCGCTCTGG AATGAACTGG TCGCGCGCAG CTGGCAGCGC 
CCGGCAGCGG CGGGCAAGCG AGGAAAGGCG ACGGAACCAA CAGAGCCGCG CTTCAATTAT 
CTGTTCGAAG ACCTCTTTAC CCTGCCAGCG CAGGCGGCGC GCTTTGTGCG CACCTATTTT 
CTGCGCATTC CCGATCTGCG TCGTCCGGCG GATGACCCGC GGCGCGCCTA TTCGCCACGC 
CGCGAAGTCG ATCTTGTTTC ATGGACCCTC GTTGAACTCT TTGTGCAGGA GGTAATGCTG 
ATGACCGATG ACCGGGTAGC CAAATTGAAG GAACTGGGCG ATAAACTGGC CGACTATACG 
CGCGCTCAGG GCGGCAAACG CTTCTTTCGC CAGTTCTTTA CCGTGCAGCG CACCGATCAC 
TTCCTGTCGC TGCTCAACAA GACCAATATC GATTATACGC GCTACAAGGG CGGCGCGGAG 
ACGCTGTTCG ATCTCGATAG CTTTCTCACC CTCTTTATGG AAGGTGAAGA GGTCCTGCGA 
TCCGACTGGC GATTGATCCG CGATCTGGTG CTCATCCGCA TGGTCGAGCA ATTGCGCGAC 
TGGATCGCTA ACAACGCGGA TGCTGTACCT TCCGAGGAGG AAGTTACAAT TGCCGAACCA 
GCCTGA

Protein sequence

MPNPIAYTGH PFIDVGFATM CALTCKRRFA DLTADDFQKV VDYIETNYVR QPLRSFLTVA 
FTSNAWFAQS AFNPDRFDDP NKKNEAQQKR TYWADRHLRQ WAQAAESLET CLFTGLPAAA 
LELSGKLQPG RVGRAQMPLL QGDDSINFFT NGDPGLPMAP EAILALQAMP LGCAKVGGGL 
LAVHCDDEAL TIEFAGQFLQ RNLADVTKAQ AAGEEKLPGS PRSLKTLLIE TLNAIQTRQA 
QEEWRRQHRP AITAYYFNNS QSPSLEIYYL PLQITGFLSA VHTPTYRALW NELVARSWQR 
PAAAGKRGKA TEPTEPRFNY LFEDLFTLPA QAARFVRTYF LRIPDLRRPA DDPRRAYSPR 
REVDLVSWTL VELFVQEVML MTDDRVAKLK ELGDKLADYT RAQGGKRFFR QFFTVQRTDH 
FLSLLNKTNI DYTRYKGGAE TLFDLDSFLT LFMEGEEVLR SDWRLIRDLV LIRMVEQLRD 
WIANNADAVP SEEEVTIAEP A