Gene Hmuk_1242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1242
Symbol
ID	8410762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1176251
End bp	1177495
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	65%
IMG OID	645019574
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003177071
Protein GI	257387298
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.473312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCACA GTGAGACAGA GGCCCTCGAC GTCGAGTCCA TCCGGGACGA GTTCCCGATC 
CTCGACCGGG AGTTCGACGG AACGCCGCTC GTGTACCTCG ACAACGCGGC GACGAGCCAG 
ACGCCGGACC AGGTCATCGA CTCGATCAGT CACTACTACC GACACTACAA CGCCAACGTC 
CACCGCGGCC TCCACCAGCT GAGTCAGGAG GCCTCGATCG CCTACGAGGA GGCCCACGAC 
CGGGTCGCGG AGTTCATCGG GGCGAGCGGC GGGCGCAAAG AGGTCGTGTT CACGAAGAAC 
ACGACGGAGT CGATGAACAC GGTCGCCTAC GCGTGGGGGC TCGCCGAGCT GGGCCCCGGC 
GACGAGGTCG TCCTCACGGA GATGGAACAC CACGCCGCGC TCGTGACCTG GCAACAGATC 
GCCAAGAAGA CCGGCGCGAC GGTGAAGTTC GTGGAGGTCG ACGAGGACGG ACGCCTCGAC 
ATGGACCACG CTCGCGAGCT GATCACCGAC GACACCGAGA TGGTCAGCGT CGTCCACGTC 
TCGAACACGC TGGGGACCGT CAACCCCGTC TCCGAGCTGG CCGACATCGC CCACGATCAC 
GACTCGCTGA TCTTCGTCGA CGGGGCGCAG TCGGTGCCAC ACATGCCCGT CGACGTGGAG 
GCCATCGACG CGGACTTCTT CGCCTTTTCG GGCCACAAGA TGTGTGGTCC GACCGGCGTC 
GGCGTCCTCT ACGGCAAAGA GCACCTGCTC GACGCGATGC AGCCGTACCT CTACGGGGGA 
ATGATGATCG AGAAGGTGAC CTTCGAGGAC TCGACGTGGC ACGAACTCCC CTGGAAGTTC 
GAGGCCGGCA CGCCGGTCAT CAGCGAGGGG ATCGCACTCG CCGAGGCCTG TGACTACCTC 
GATTCGATCG GGATGGAGCG CGTCCACCGC CACGGCACGG AACTGGCGGC GTACGCCTAC 
GACCGCCTCC AGGAGTTCGA CGACATCGAG ATTCTGGGGC CGGGCGGCGA CGAACGGGCC 
GCGCTGGTCT CGTTCGACAT GGACAACGTC CACGCCCACG ACGTTTCGGA GATTCTCAAC 
GCCAACGGCG TCGCCGTCCG CGCGGGCGAT CACTGTACGC AGCCGCTACA CGACAAGCTC 
GGCGTCTCCG CGTCGACGCG GGCTTCGTTC TACATCTACA ACACTCGCGA GGAAGTGGAC 
GCGCTGGTCG ACGCACTCGA TCAGGCCCGC GAGCTGTTCG CGTAG

Protein sequence

MSHSETEALD VESIRDEFPI LDREFDGTPL VYLDNAATSQ TPDQVIDSIS HYYRHYNANV 
HRGLHQLSQE ASIAYEEAHD RVAEFIGASG GRKEVVFTKN TTESMNTVAY AWGLAELGPG 
DEVVLTEMEH HAALVTWQQI AKKTGATVKF VEVDEDGRLD MDHARELITD DTEMVSVVHV 
SNTLGTVNPV SELADIAHDH DSLIFVDGAQ SVPHMPVDVE AIDADFFAFS GHKMCGPTGV 
GVLYGKEHLL DAMQPYLYGG MMIEKVTFED STWHELPWKF EAGTPVISEG IALAEACDYL 
DSIGMERVHR HGTELAAYAY DRLQEFDDIE ILGPGGDERA ALVSFDMDNV HAHDVSEILN 
ANGVAVRAGD HCTQPLHDKL GVSASTRASF YIYNTREEVD ALVDALDQAR ELFA