Gene Rcas_1981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1981
Symbol
ID	5539459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2537003
End bp	2538433
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	65%
IMG OID	640894116
Product	CRISPR-associated RAMP Csm5 family protein
Protein accession	YP_001432087
Protein GI	156741958
COG category	[L] Replication, recombination and repair
COG ID	[COG1332] Uncharacterized protein predicted to be involved in DNA repair (RAMP superfamily)
TIGRFAM ID	[TIGR01899] CRISPR-associated RAMP protein, Csm5 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.244308
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTGG TGCGCAACCA GGTCGTTTCC CTGACCGTCA CTACCATCAC GCCGCTCCAC 
ATCGGCACAG GCGACCGGCT GGCGGCAAAC CTGGATTACT ATGTGGACGG CGACGCCACG 
CTGGTGATCA ATGCTGACGC TGCGCTCGAA TTGGTGGTCG AAACCTGGCA GCAGCGCCGC 
GTGCCGTATG AGGAGCAACT GCGGCGCTTC AACGCAGAAC TGGCGCAGGA AGAAGAACGC 
ATCCGCCGGG CGGACGAGCG TCTGCGTCGT CAGATTGAGC AGTTCGAGGA GAGTCCGCCG 
CGGCGCAAGG ACGAGTATGA ACGTCAGGCG AACCGTTTTC GTGAGGAGGC GCAGCGTCTG 
AAGGAACGCA AGCAGCGCCT GGCGGAGCAC AGCGCGAATC CGCCGCAGCC GGACGATACC 
GGCGATCTGT TGCCGCCGGA ATTGATCGCC GGCAGCACGT TCGACCAACT GGTTGATGGC 
GGGTTGTTGC CACGCGACCG GTTGCGTGAA CGCGCAACGG TCAACGGGCG TCCGCTGGTG 
CGCTATGCGC TGAACGGACG CCCGGCGTCC GGCGAGGTCT ACGAGCAGAT TAAGGATGTC 
GCCGACCGAC TCTATCTGCC GGGGTCGTCG CTCAAAGGCG CAATCCGCAG CGCGCTGGCG 
TGGGACATGG CGCACAGTCC GGCGGTCGCG GCGCTTCAAC ATGCGGTGAA GGGGGGGCCG 
AAAAACGCTG ATGACGCCAT CGAACAGGAG GTGTTTCTCG GCACGCTGCG AACGCAACGC 
CGTATCAACA ACACGGTGCG TGACGTGCTG CGCGCGCTCC GCATCGGTGA CAGCGCGCCG 
GTCGCAGTTG CGCCCGATCT GCTGGCGGTG CGCATCTACC GCAGCCGGTC GGCGCAGGGA 
TTGATTGCGC TCGAAGCCAT CCCCGTCGAT GTCGAGTTTC GCGCAGCGCT TCAGATCGAA 
CAGTATCCGT TCGAGAGCGG GGTCGCGCGC GCCGTGATCG ACTTCGGCGA TTGGCAGCGC 
CGGTTGCAGC CGGATGAACT TGCGGCAGCG TGCCGACGGC GCGCCGGGCG CCTGATCGAC 
GGCGAACTCG CATATTTCAA CCGCCAGACC GACGCCGCCG AACTGGTCCG CTTCTATGCC 
GATCTGCGCG CGCGCCTGGA AAGGATGGAT GCGCGCGCGT TTCTGTTGCC CATCGGCTGG 
GGCGCCGGTT GGCGCTCCAA GACCCTCGAC GACCGGTTGC GCCAGGGGAC GGATCGTGAC 
AATGCGTTTG CGCAAATCGT TCAACGTCAC ACCCTCAAAA AGCACAAATC CGCCGGTTTT 
CGCCCCGGCG ACGCTTTCCC GGAGACGCGC AAAGTCATCA TGCGCGGCGC ATTACCCTGG 
CGACCGCTTG GGTGGGTCGA GGCGCGCTTC GATCTGAACG GTGAACGTTG A

Protein sequence

MALVRNQVVS LTVTTITPLH IGTGDRLAAN LDYYVDGDAT LVINADAALE LVVETWQQRR 
VPYEEQLRRF NAELAQEEER IRRADERLRR QIEQFEESPP RRKDEYERQA NRFREEAQRL 
KERKQRLAEH SANPPQPDDT GDLLPPELIA GSTFDQLVDG GLLPRDRLRE RATVNGRPLV 
RYALNGRPAS GEVYEQIKDV ADRLYLPGSS LKGAIRSALA WDMAHSPAVA ALQHAVKGGP 
KNADDAIEQE VFLGTLRTQR RINNTVRDVL RALRIGDSAP VAVAPDLLAV RIYRSRSAQG 
LIALEAIPVD VEFRAALQIE QYPFESGVAR AVIDFGDWQR RLQPDELAAA CRRRAGRLID 
GELAYFNRQT DAAELVRFYA DLRARLERMD ARAFLLPIGW GAGWRSKTLD DRLRQGTDRD 
NAFAQIVQRH TLKKHKSAGF RPGDAFPETR KVIMRGALPW RPLGWVEARF DLNGER