Gene Mesil_1233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mesil_1233
Symbol
ID	9250727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Meiothermus silvanus DSM 9946
Kingdom	Bacteria
Replicon accession	NC_014212
Strand	+
Start bp	1217218
End bp	1218384
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	60%
IMG OID
Product	CRISPR-associated protein, Cse4 family
Protein accession	YP_003684638
Protein GI	297565666
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00111756
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.718248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACACC TGCTCGAGAT CCACATCTTG CAAAACTTTG CCCCCAGCAA CCTCAACCGC 
GACGATACCG GTTCTCCCAA GGACGCCATT TTTGGCGGGG TGCGCCGGGG GCGCATCAGC 
AGCCAGTGCC TCAAGCGGGC CGCGCGGGAG TATGTGCGCG ATCACCCGGG CGGCCTGCCT 
CAGGAGGCGC TGGCTTTGCG CACCAAGCGG CTGGTGCAAG CATTGGTAGA ACAGCTTAAG 
GCCAAGGGCC GGGACGAGGA GGAAGCCCGG CAGAAAGTAG AGCAAGCCTT AGGTGGGATG 
GGCCTGAAGG TAGATGCAGA GGGCAAAACC CAGTACCTGC TGTTCTTGGG CAAGCAAGAG 
GTAGCGAGAA TTGCCGACCT TATCGAACAG CACTGGGATG GCCTGGTGGC CCCCCAAGCC 
GAGGAGGAGG GGGGTAAAAA GAAAGCCAGG GAAGCTAAGA AAGCTGCCAA GGAAGCCGTC 
CCTGACGAGA TCAAAAAAGC TTTGGGCAGT GTGCTGGATG GGGGCAAGGC CCTGGATGTA 
GCGCTCTTTG GCCGCATGCT GGCCGATTTG CCTGAGAAGA ACCAGGACGC CGCCTGCCAG 
GTAGCCCACG CCATCTCCAC CCACGCCGTC GAGCGCGAGT TCGACTTCTA CACCGCCGTG 
GACGACCTCA AACCTGACGA CAACGCCGGG GCGGACATGC TGGGCACGGT AGAGTTCAAC 
TCGGCCTGCT TCTACCGTTA TGCGGCCATA GACCTCGAGA AGCTACGTGC GAACCTCCAG 
GGCGATGCCG AGCTGATGCT TAAGAGCCTC GAGGCTTTCC TCAGGGCCAT GGTCAAGGCC 
AAGCCCAGCG GAAAGCAAAA CTCCTTCGCC GCCCACAATG ACCCGGAGTA CGTCGTTTTC 
ACCGTGCGCC AGGAGGCCGA CCCGCGCAAC CTGGCCAACG CCTTTGAGAA GCCGATTCGT 
CCTAACAAGG AGAAGAGCCT CACCGAGGCT TCGCTGGAGC AGCTCGAGGC CAAGTGGCAG 
AAACTCTCCG AGGCCTACGA CCAAAATGGA GAGGCCTGGG TACTCAACCT GACCGAGGTA 
AAAAGCCAAA TCGGCACACC TGTCAAAAAC CTGGGCGAAC TCGTCGCAAA GGCGCTGGAA 
AAGGTCAGGG CTAACATGGG GGTCTGA

Protein sequence

MKHLLEIHIL QNFAPSNLNR DDTGSPKDAI FGGVRRGRIS SQCLKRAARE YVRDHPGGLP 
QEALALRTKR LVQALVEQLK AKGRDEEEAR QKVEQALGGM GLKVDAEGKT QYLLFLGKQE 
VARIADLIEQ HWDGLVAPQA EEEGGKKKAR EAKKAAKEAV PDEIKKALGS VLDGGKALDV 
ALFGRMLADL PEKNQDAACQ VAHAISTHAV EREFDFYTAV DDLKPDDNAG ADMLGTVEFN 
SACFYRYAAI DLEKLRANLQ GDAELMLKSL EAFLRAMVKA KPSGKQNSFA AHNDPEYVVF 
TVRQEADPRN LANAFEKPIR PNKEKSLTEA SLEQLEAKWQ KLSEAYDQNG EAWVLNLTEV 
KSQIGTPVKN LGELVAKALE KVRANMGV