Gene Namu_3052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3052
Symbol
ID	8448665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3361605
End bp	3362741
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	66%
IMG OID	645042135
Product	CRISPR-associated protein, Cse4 family
Protein accession	YP_003202377
Protein GI	258653221
COG category
COG ID
TIGRFAM ID	[TIGR01869] CRISPR system CASCADE complex protein CasC/Cse4

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.000809112
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00221304
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGTGCA TCGACATCCA CATCCTGCAG ACCGTCCCGC CGAGCAACCT CAACCGTGAC 
GACACCGGCA GCCCGAAGAC GGCAATCTAC GGCGGCGTTC AGCGCGCCCG CGTGTCGAGC 
CAGGCATGGA AACGGGCTAC CCGCAAGGCA TTCGATGGTC GAATCAAGCC GGCGGACCTC 
GGGGTGCGCA CCAAACGGGT CGTCGAGTTG GTCAGTGAAG AGATCCTCCG CCAATCACCG 
GGGGTCGGCG CCGAGGGCGC GGTCGAACTG GCCAAGAAGG TCCTGGTGGC TGCTGGCATC 
ACGTTGAGCG CGCCGAAGCC GAAAAAGAAG GGGGAAGCGC CTGGTCTCGA CGAGTCCGGG 
TACCTGCTGT TCCTGGCCCG GCATCAGGTC GAGCGACTCG CCGAACTCGC CATCGGCGCC 
GCCGAGGAAA CGACGATCGA CAAGAAGCAG GCCAAGGCCG CCGCTGACTC CAGCCAGAGC 
GTGGACGTCG CGCTGTTCGG TCGGATGGTC GCCGACGCCG CCGACCTGAA CGTCGACGCC 
GCGGCGCAGG TTGCCCACGC ACTCTCCGTA CATGCCGTCC GCAACGAATT CGACTATTTC 
ACCGCCGTTG ACGACCGTAA AGAAAATGAG GAGGAGACCG GGGCCGGCAT GATCGGAACG 
GTGGAGTTCA ACTCTTCCAC GCTCTACCGC TACGCGACGG TGAACATCGA CGGGCTGCGG 
GTCAACCTCG GTGACGATGC TGCCACGATC CGCGCGGCTC AGGAATTCGT TCGTGCCTTC 
GTGACTTCAA TGCCCACCGG AAAGCAAAAC ACTTTCGCCA ATCGCACCCT GCCCGACGCC 
GTCGTGGTGC AGGTCCGCGA CTCCCAGCCG ATCAACTTGG TCGGTGCCTT CGAGGAACCC 
GTCGAGGTCC CGGCCGGCGG ATCCCGGCTG CGGGAAGCCG CGGACCGGCT CGTCGCTCAC 
GCGCAGAGCG TCGACCACGC CTACGGCACC GCGCCCACCC GATCGATGAC AGTGCTGGCG 
TCGCCCACCG TCGGGACCCT CGCGGCCCTG GGGGAGTCGA TCGCGCTCGA CGACATGATC 
GCAGCGGTGG GGGAGGCGGT CGCCGACGCT TTGGTCGCCT CCGCGGTCCG GGCGTGA

Protein sequence

MKCIDIHILQ TVPPSNLNRD DTGSPKTAIY GGVQRARVSS QAWKRATRKA FDGRIKPADL 
GVRTKRVVEL VSEEILRQSP GVGAEGAVEL AKKVLVAAGI TLSAPKPKKK GEAPGLDESG 
YLLFLARHQV ERLAELAIGA AEETTIDKKQ AKAAADSSQS VDVALFGRMV ADAADLNVDA 
AAQVAHALSV HAVRNEFDYF TAVDDRKENE EETGAGMIGT VEFNSSTLYR YATVNIDGLR 
VNLGDDAATI RAAQEFVRAF VTSMPTGKQN TFANRTLPDA VVVQVRDSQP INLVGAFEEP 
VEVPAGGSRL REAADRLVAH AQSVDHAYGT APTRSMTVLA SPTVGTLAAL GESIALDDMI 
AAVGEAVADA LVASAVRA