Gene Rru_A0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A0344
Symbol
ID	3834631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	416445
End bp	417590
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	62%
IMG OID	637824427
Product	CRISPR-associated Cse4 family protein
Protein accession	YP_425436
Protein GI	83591684
COG category
COG ID
TIGRFAM ID	[TIGR01869] CRISPR system CASCADE complex protein CasC/Cse4

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCGT CCCGTTTTCT GCAAATCCAC AGTTTGCATT CCTATACGGC GGCGCTTTTG 
AACCGGGATG ATTCCGGTCT GGCCAAGCGG CTGACCTATG GCGGATCAAA CCGCACCCGC 
ATTTCCTCGC AATGCCTGAA GCGTCACTGG CGGATGGCCG AGCACGACCC CCATGCCCTG 
CAGACCCTGG GGGGATACGT TGGCTCGTTC CGCTCGCGCG AATTGGTTAC GGATCTGGTG 
ATCAAGCCGC TTGAGGGGCG TTATCCCCAG GACATCCTTG ATGTCCTGGA GCCGGAGTTT 
CAGAAACTGG TTTATGGGGA CAAGGCGGAC AAGGGCAAGA AAAGCCGCCA GACCCTGTTG 
TTGGGACAGC CCGAACTGGC GTGGCTGGCC CGGCGGGCGG AAGAACTCGC CGCCGGGGCA 
AACGATGCGA AAGCCTTGCA AAAGGCCGTC GCCGATTGGC GGAAAGACGC GAATTTCAAG 
GCGATGAGCG AGAACGCGGC GCTGCCCGGC GGTCTTGTCG CCGCCTTGTT CGGCCGCATG 
GTGACATCCG ATCCGGCGGC CAATATCGAC GCGCCGGTGC ATGTCGCCCA TGCCTTCACC 
GTTCATGCCG AAGAGGCGGA GGGCGATTAC TTCACCGCCG TTGATGATCT GAAAAAAGAC 
GAGAGCGATA GCGGCGCCGA TACGATCCAG GAAACCGAAC TAACCTCGGG CCTGTTCTAT 
GGCTATGTGG TGATCGATCT GCCCGGCCTG ATCGGTAATT GCGGCGGTGA CAAGGAGATC 
GCCGCCCAAG TGGTGAATAA TCTTGTCTAT CTCATCGCCG AAGTTTCCCC GGGCGCCAAG 
CTGGGCTCCA CCGCGCCCTA TGGCCGCGCC GATCTGATGC TGATCGAAGC GGGCGACCGC 
CAGCCCCGCA GTCTGGCGAC GGCCTATCGC AAGGCGATCG CCCCTGATCG CGAACAGGCG 
GTGGCGGCTC TGGACGGCTG TTTGGCCAAG CTTGATGCCA CCTATGAGAC GGGGGAGGCC 
CGGCGCTATC TGTCGCTGGC CGAAACGCCC TTGACCGGAC CGGCGACCAG CGGCTTGGAA 
AAGCTGTCGC TCAAGGCCCT GGCGGACTGG ACGGCGAGCC GGGTGAAGGA GGCTCCCGAT 
GCCTGA

Protein sequence

MTPSRFLQIH SLHSYTAALL NRDDSGLAKR LTYGGSNRTR ISSQCLKRHW RMAEHDPHAL 
QTLGGYVGSF RSRELVTDLV IKPLEGRYPQ DILDVLEPEF QKLVYGDKAD KGKKSRQTLL 
LGQPELAWLA RRAEELAAGA NDAKALQKAV ADWRKDANFK AMSENAALPG GLVAALFGRM 
VTSDPAANID APVHVAHAFT VHAEEAEGDY FTAVDDLKKD ESDSGADTIQ ETELTSGLFY 
GYVVIDLPGL IGNCGGDKEI AAQVVNNLVY LIAEVSPGAK LGSTAPYGRA DLMLIEAGDR 
QPRSLATAYR KAIAPDREQA VAALDGCLAK LDATYETGEA RRYLSLAETP LTGPATSGLE 
KLSLKALADW TASRVKEAPD A