Gene Hmuk_3119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3119
Symbol
ID	8412672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2997104
End bp	2998285
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	645021466
Product	von Willebrand factor type A
Protein accession	YP_003178931
Protein GI	257389158
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1240] Mg-chelatase subunit ChlD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCTA TCGAGACGAG CGTCAATCGG CCGAACGTAC CGGCCGACGG CACGACCGTG 
ACCGCCGAGA TCGACGTCGA GCCGGGAGAA CAGGAGACGG ACGTGCGACG CCACATCGCG 
CTCTGTATCG ACACGAGCGG GTCGATGGAG GGTGACAACA TCAAACGCGC TCGCGACGGC 
GCTGCGTGGG TCTTCGGGCT GTTGGCCGAC GAGGACTACG TGAGTATCGT CGCGTTCGAC 
ACCGAGGCGA CGGTGATCCT GCCCGCGACA CGGTGGTCGG ATCTCGACCG CCAGACGGCG 
ATGGACCACG TCGAGGAGCT GACTGCCGGC GGCGGCACCG ACATGTACAA CGGGCTCAAG 
GCCGCCAAGG AGACGCTGTC GTCCTCCGCG ACCGGGCCCG ACACGGTCAA GCGACTCCTC 
TTGCTCTCGG ACGGCAAGGA CAACGAACGC ACGCCCGACG AGTTCGAGGG GCTGGCCGAA 
GCCATCGACG ACGCCGGGAT CCGGATCCAG TCGGCCGGGA TCGGGACCGA CTACAACGAG 
GCCACGATCC GGACGCTCGG GACGGCCGGG CGCGGGACGT GGACCCACCT CGAAGCGCCC 
GGCGACATCG AGGACTTCTT CGGCGAGGCC GTCGAGCAGG CCGGCTCCGT CGTCGCGCCG 
GACGCCCACC TCGACCTCGA CGTGGCCCCC GGCGTCGAGG TCAGCGAGGT GTATCGCGCG 
CTCCCGCAGG CCCAGGAAGT CTCGCCCGAG TGGGAGGCAA ACGCCACCCG GGTCAAGCTC 
CCCGACCTGA TCGAACGGGA GAGCCAGCGG GTCGTCCTCA AGATCCACGC GCCGCCCCGC 
GAGCCCGGCA GCGAGGAGGT GCTCGCGGAC GTACAGCTCT CGGCCCGCGG CGACACCGCC 
AGCGACCAGA TCGGCGTCGA GTACACGGAC GAACAGGAGA AGCTGGCCGA GCACAACGAG 
TCCGTCGACA TCGACCACAA ACAGACCGTC ATCCGGACGG AGCTCGGCAA GGGCAACGTC 
GAGGCCGCGG AGACGAAAGT CGAGCAGATG ACAGTGATCC ACGGCGAGGA CGCCGAGGCG 
GTCCAGGAGG CCGAGCGCCA GACCGAGATC GTCAAAGAGG GCGGTCGTGC CGAACAGAGC 
CAGGCGACCC AGATCGTCGA CAGCGACGAC GGCATCCAGT GA

Protein sequence

MASIETSVNR PNVPADGTTV TAEIDVEPGE QETDVRRHIA LCIDTSGSME GDNIKRARDG 
AAWVFGLLAD EDYVSIVAFD TEATVILPAT RWSDLDRQTA MDHVEELTAG GGTDMYNGLK 
AAKETLSSSA TGPDTVKRLL LLSDGKDNER TPDEFEGLAE AIDDAGIRIQ SAGIGTDYNE 
ATIRTLGTAG RGTWTHLEAP GDIEDFFGEA VEQAGSVVAP DAHLDLDVAP GVEVSEVYRA 
LPQAQEVSPE WEANATRVKL PDLIERESQR VVLKIHAPPR EPGSEEVLAD VQLSARGDTA 
SDQIGVEYTD EQEKLAEHNE SVDIDHKQTV IRTELGKGNV EAAETKVEQM TVIHGEDAEA 
VQEAERQTEI VKEGGRAEQS QATQIVDSDD GIQ