Gene Hmuk_3199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3199
Symbol
ID	8412752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	3087043
End bp	3089124
Gene Length	2082 bp
Protein Length	693 aa
Translation table	11
GC content	66%
IMG OID	645021544
Product	ATP-dependent protease Lon
Protein accession	YP_003179009
Protein GI	257389236
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID	[TIGR00764] lon-related putative ATP-dependent protease

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.11002
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA ATACCGAGAT CGACGACACT CCCGACGACG AGCGGGAGGT GACCGGGACG 
CCGCCCGAAG ACGACGACCA CAGCGCGGCC GACGACGCTG GTGACACTGT GGAGAGTGGC 
GGGGCCGAAG GTGGCGGCCT CGACGACCTC GGCAGTGAGG TCGAAGTCGA GAGCGGCGCG 
TCCCTCGACG ACGAAGACGG GCTCCTCGGT GGGCTCGGCA TCGAGTCGAC CAGCGACATC 
GAAGTCCCCG ACCGACTCGT CGATCAGGTC ATCGGGCAGG ACCACGCCCG TGACGTCATC 
AAAAAGGCAG CCAAACAGCG CCGTCACGTG ATGATGATCG GCTCGCCCGG GACGGGCAAG 
TCGATGCTGG CCAAAGCGAT GAGCCAACTG CTCCCGAAAG AGGAACTACA GGACGTTCTG 
GTCTACCACA ACCCGGACGA CGGAAACGAG CCGAAGGTTC GAACCGTCCC CGCCGGGAAG 
GGCGAACAGA TCGTCGACGC CCACAAGGAG GAGGCCCGCA AGCGAAACCA GATGCGGACC 
TTCCTGATGT GGATCATCAT CGCCATCATC ATCGGTTACG CGCTGATCAT CCAGGGGTCG 
GTCCTGCTGG GGATCCTCGC GGCCGGTGTC ATCTACCTGG CCTTCCGCTA TGGCTCGCGT 
GGCAACGACT CGATGATCCC GAACCTGCTG GTCAACCGCG CGAACCAGAC CACCGCGCCC 
TTCGAGGACG CGACCGGTGC CCACGCCGGT GCGCTGCTGG GCGACGTTCG CCACGACCCG 
TTCCAGTCCG GTGGGATGGA GACGCCCAGC CACGACCGCG TCGAGGCCGG CGCGATCCAC 
AAGGCCAACA AGGGCGTCCT GTTCGTCGAC GAGATCAACA CGCTGGACAT CCGCAGCCAG 
CAGAAACTCA TGACCGCGAT CCAGGAGGGC GAGTTCTCCA TCACTGGCCA GTCCGAGCGC 
TCCTCGGGCG CGATGGTCCA GACCGAGCCC GTCCCCTGTG ATTTCATCAT GATCGCGGCG 
GGGAACCTCG ACGCCATGGA GAACATGCAC CCCGCGCTGC GCTCCCGGAT CAAGGGGTAC 
GGCTACGAGG TGTACATGGA CGACACCATC GAGGACACCC CGGAGATGCG CCGGAAGCTC 
ACCCGCTTCA TCGCACAGGA AGTCGAGAAC GACGGGCGAC TCCCCCACTT CGACCGCGAG 
GCCGTCGAGG AGATCATCCT CGAAGCCCGC CGCCGCGCGG GCCGCAAAGG GCACTTGACC 
CTGAAACTGC GCGAACTGGG CGGACTGGTC CGCGTCGCGG GCGACATCGC CCGCGCGGAG 
GATCAGGACG TGACCACTCG CGAGGACGTG CTCCAGGCCA AAGGCCGGAG TCGCTCCATC 
GAGCAACAGC TCGCAGACGA CTACATCGAA CGCCGCAAGG ACTACGAACT GACCGTCAAC 
GAGGGCGACG TGGTCGGCCG CGTCAACGGT CTGGCCGTGA TGGGCGAGGA CAGCGGGATC 
GTCCTCCCGG TCATGGCGGA GGTCACGCCC TCGCAGGGTC CCGGTCAGGT GATCGCCACC 
GGCCAGCTCA AGGAGATGGC CGAGGAGGCA GTCCAGAACG TCTCGGCGAT CATCAAGAAG 
TTCTCGGACG AGGACATCTC CGAGAAGGAC GTTCACATCC AGTTCGTTCA GGCCGGCGAG 
GGCGGTGTCG ACGGCGACTC CGCCTCGATC ACGGTCGCGA CGGCGGTCAT CTCCGCGCTG 
GAGAACGTTC CGATCGAGCA GAACCTCGCG ATGACCGGCT CGCTGTCGGT GCGGGGCGAC 
GTGTTGCCCG TCGGCGGCGT GACCCACAAG ATCGAGGCCG CGGCCAAGTC CGGGCTCGAT 
ACGGTCATCA TCCCCGAGGC AAACACCCAG GACGTGATGA TCGAAGAGGA GTACGAGGAG 
ATGATCGAGA TCGTCCCGGT CTCGCACATC TCCGAGGTGC TGGAAGTGGC CCTGGCCGGC 
GAGCCCGAGA AGGACTCGCT GGTCGACCGG CTCAAGTCCA TCACCGGCAA AGCGCTCGAA 
CGCGAAGTGG GCCAGCAGAG CGGCTCACCC AGCCCGCAGT AG

Protein sequence

MSDNTEIDDT PDDEREVTGT PPEDDDHSAA DDAGDTVESG GAEGGGLDDL GSEVEVESGA 
SLDDEDGLLG GLGIESTSDI EVPDRLVDQV IGQDHARDVI KKAAKQRRHV MMIGSPGTGK 
SMLAKAMSQL LPKEELQDVL VYHNPDDGNE PKVRTVPAGK GEQIVDAHKE EARKRNQMRT 
FLMWIIIAII IGYALIIQGS VLLGILAAGV IYLAFRYGSR GNDSMIPNLL VNRANQTTAP 
FEDATGAHAG ALLGDVRHDP FQSGGMETPS HDRVEAGAIH KANKGVLFVD EINTLDIRSQ 
QKLMTAIQEG EFSITGQSER SSGAMVQTEP VPCDFIMIAA GNLDAMENMH PALRSRIKGY 
GYEVYMDDTI EDTPEMRRKL TRFIAQEVEN DGRLPHFDRE AVEEIILEAR RRAGRKGHLT 
LKLRELGGLV RVAGDIARAE DQDVTTREDV LQAKGRSRSI EQQLADDYIE RRKDYELTVN 
EGDVVGRVNG LAVMGEDSGI VLPVMAEVTP SQGPGQVIAT GQLKEMAEEA VQNVSAIIKK 
FSDEDISEKD VHIQFVQAGE GGVDGDSASI TVATAVISAL ENVPIEQNLA MTGSLSVRGD 
VLPVGGVTHK IEAAAKSGLD TVIIPEANTQ DVMIEEEYEE MIEIVPVSHI SEVLEVALAG 
EPEKDSLVDR LKSITGKALE REVGQQSGSP SPQ