Gene Hmuk_2834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2834
Symbol
ID	8412385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2715133
End bp	2716188
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	63%
IMG OID	645021179
Product	CRISPR-associated protein, Csh2 family
Protein accession	YP_003178646
Protein GI	257388873
COG category	[L] Replication, recombination and repair
COG ID	[COG3649] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR01595] CRISPR-associated protein, CT1132 family [TIGR02590] CRISPR-associated protein, Csh2 family

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAC ACTATCCCAC CGTTTCGAAC AGGTCCGAAA TCGTCTTCGC GTACGACGCG 
GTCGACGCGA ACCCCAACGG CAATCCGCTG AGCGGCGCGA ACCGACCGCG TATCGACCCC 
CACACCGATC AGGCGATCGT CACCGACGTT CGCCTCAAGC GCTACCTCCG CGATCAGCTA 
CAGGACGACG GTCACGGCGT CTACATTCGC AACGTCAAGG AAGACGACGG CGATCAGGCG 
ACCCGCGAGG ACCTCCTCGA AGACCGTCTC AAGGACATCG ACCTCGACGA CGTGGACGAA 
GCCGACATCG AAAACGCCGT CTTCGGTCAG TTCCTCGAAA ACAGCGCCGA CGTTCGCTAC 
TTCGGCGCGA CGATGAGCAT CGATATGGAC GATGAGAAGG TCGACCACCT CCCGGATCAC 
TTCACCGGTC CCGTCCAGTT CTCGCCGGGC AAGTCGCTCC ACCGAGTCAT GGAAAACGAG 
GAGTACAACA GCCTCACAAG CGTCATCGCG ACCGGCGACG ACAAGGCACA GGGCGGGTTC 
GATCTCGACG ACCACCGGAT CCAGTACGCG TTCATCGGGT TCCACGGACT CGTCGACGAG 
CACGGGGCCG AAGGCACGCT CCTGACGGAT GGGGACGTGC GGCGACTGGA CACGCTGTGC 
TGGCGCGCGC TGAAGAACCA GACGATCAGC CGGAGCAAGG TCGGACAGGA GCCCCGGCTC 
TACCTCAGAG TCGAGTACGC CGACGAGAGC TTCCATCTCG GCGGGCTCGA TCAGGACATC 
GATCTCGACA GTTCGGAATC CGCTCCCGTC GAGGAAATTC GCAACGTCCG AGACATCTGT 
GTCGACGTGT CGGCGCTGCT CGAACGGCTC GACGCGGCGT CCGACCGGAT CGACACCGTC 
CACGTCGTCG CCAGCGACGT TCTCGAACTC TCCGTCGACG GTGAGACGGG CGGTCCGGAG 
TTCCTCTACG ACGCCCTCGA ATCGAGGGTC GGTAGCGAAT CCGTCCGCGA GATCGACGTG 
TACGAGGACG CGAAGGCGAC GATGCCGGAG GAGTGA

Protein sequence

MSEHYPTVSN RSEIVFAYDA VDANPNGNPL SGANRPRIDP HTDQAIVTDV RLKRYLRDQL 
QDDGHGVYIR NVKEDDGDQA TREDLLEDRL KDIDLDDVDE ADIENAVFGQ FLENSADVRY 
FGATMSIDMD DEKVDHLPDH FTGPVQFSPG KSLHRVMENE EYNSLTSVIA TGDDKAQGGF 
DLDDHRIQYA FIGFHGLVDE HGAEGTLLTD GDVRRLDTLC WRALKNQTIS RSKVGQEPRL 
YLRVEYADES FHLGGLDQDI DLDSSESAPV EEIRNVRDIC VDVSALLERL DAASDRIDTV 
HVVASDVLEL SVDGETGGPE FLYDALESRV GSESVREIDV YEDAKATMPE E