Gene Hmuk_1372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1372
Symbol
ID	8410892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1297554
End bp	1298735
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	59%
IMG OID	645019703
Product	chitin-binding domain 3 protein
Protein accession	YP_003177200
Protein GI	257387427
COG category	[S] Function unknown
COG ID	[COG3397] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.507673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGAAG ATCCGGTAAT ACACAAACGA GTTGCGGGGA GTAGCCTACC ACGTGTCACC 
AAGTCACGTG TCGCAAAGAC GGGGGTACTG ATCCTCTTTT TGACGGTTCT CGGCCTCGTT 
GCGGTACAGA CGGCCGCCGC CCATGGAGCA CCGTCGGATC CAATTGGCCA GGGGTTGGCC 
TGTTACGAGG AGGTCAAGAA TGAGGGAGAG ACAAACGAGA TGTGTGAGTT TGCACGCGAG 
CAGAGCGGAC AGGCAATCTA CAACTGGCAG GGAATTCGCG ACGGTGATGC GGGCGGCGAT 
CACCAGGAGA ACATCGATGA CGGTGAACTC TGTAGTGCCG GAAGCGAAAG ATACGCTCCG 
TACGATGAGC CTGGAGACTG GCCTTCGACG ACGATCGAGC CCGGTACGCA GACGTTTACT 
CTCGATCTGA CCGCGCCACA CGAAGCCGAG TACTTCAGGT TCTACATGAC CAAGGATGGA 
TGGAATCCAG ACACCGCGCT TGCGTGGGAC GACCTAGAAC AGATCCACGA AACGGGTCCA 
ATGAGTCCCA CTGAAACGAC GGAGATCAGT GGTGTGGACG TCCCCGACCG CGATAACAAG 
GAACACGTCA TCTACATGGT CTGGCAGCGA TCCGATTCGC CAGAAGCGTT CTATTCGTGC 
TCCTATGTTG ACATTGCCGG CGCTGATGAT GGCAACGATG ATACGCCAGA TCAGCCCGAC 
ACGCCAACTG ACACGCCAGA TCAGCCCGAC ACGCCAACTG ACACGCCAGA TCAGCCCGAC 
ACGCCAACTG ACACGCCAGA TCAGCCCGAC ACGCCAGATC AGCCGGACGT GCCCGCGTGG 
GACTCCGGAG CCACGTACAC GAGCGGCGAC CAGGTGACCT ACAACGGCAA AACGTGGGAG 
GCCAACTGGT GGACGCAGGG TGACGAACCC GGTTCCTCCG AGTGGGGTCC CTGGGAGCAG 
GTCTCAGGCG ATGACACGCC AGATCAGCCC GACACGCCAA CTGACACGCC AGATCAGCCC 
GACACACCCG ATCAGCCGGA CGTGCCCAAG TGGAATTCGA GTACGGCCTA CACAAGTGGA 
GATCAGGTGA GCTATGACGG CGAAACGTGG GAAGCCAACT GGTGGACTCA GGGTGACGAA 
CCCGGTAGCT CCCAGTGGGG GCCGTGGGAA CGAGTAGAGT AG

Protein sequence

MGEDPVIHKR VAGSSLPRVT KSRVAKTGVL ILFLTVLGLV AVQTAAAHGA PSDPIGQGLA 
CYEEVKNEGE TNEMCEFARE QSGQAIYNWQ GIRDGDAGGD HQENIDDGEL CSAGSERYAP 
YDEPGDWPST TIEPGTQTFT LDLTAPHEAE YFRFYMTKDG WNPDTALAWD DLEQIHETGP 
MSPTETTEIS GVDVPDRDNK EHVIYMVWQR SDSPEAFYSC SYVDIAGADD GNDDTPDQPD 
TPTDTPDQPD TPTDTPDQPD TPTDTPDQPD TPDQPDVPAW DSGATYTSGD QVTYNGKTWE 
ANWWTQGDEP GSSEWGPWEQ VSGDDTPDQP DTPTDTPDQP DTPDQPDVPK WNSSTAYTSG 
DQVSYDGETW EANWWTQGDE PGSSQWGPWE RVE