Gene Hmuk_3029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3029
Symbol
ID	8412582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2916492
End bp	2918333
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	68%
IMG OID	645021376
Product	glycosyl transferase family 2
Protein accession	YP_003178841
Protein GI	257389068
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.586376
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0326144
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG TGGAAGTCAG CGTCGTCCTG CCGGCCTACA ACGAGGCCGC GACCATCGAG 
GAGACGGTCG AGACGACGCT GTCGACGCTT GCAGCCTTCC TGCCAGCGGG GAGCTTCGAA 
GTGATCGTCG CGGAGGACGG CTGTGAGGAC CGCACACCGG AGATCGCGAC CCGGATGGCC 
GACGCCGACG AGCGCGTACG CCACGTCCAC TCCGACGAGC GACTCGGACG AGGCGGGGCG 
CTGTCCTACG CTTTCCGGCA GGCGGAGGGC GAGACGCTGG TGTACTTCGA TACGGATCTG 
GCGACGGACA TGCGCCACCT CGAAGAGCTG GTCGAGTCGG TCCGTTCGGG CGAGTACGAC 
GTGGCCACGG GATCGCGCTG GCTCCCCGAG AACCGGGCCG ATCGCCCCGC GAAACGAGGG 
GTGCCGAGTC TCGGCTACAA CACCCTCGTG CGGCTGTTCC TGCGATCGGA TCTGCAGGAC 
CACCAGTGTG GCTTCAAAGC GTTCGATCGG GCGGCGGCGC TCGATCTCCT CGACGAAGTC 
GAAGACGAAC ACTGGTTCTG GGACACGGAG CTGCTGGTCC GCGCCCAGCG CGAGGGCTAC 
CGCGTCAAGG AGTTCCCGGT CGACTGGACG CCGAAGGGCG ACTCGAAGGT CGATCTCGTG 
CGGGACGTGT TCGGGATGGG GAGCCAGATC GTCCGAACAT GGTGGCAGCT GTCGGTGAGC 
CCACGGATCA CGCGGAAGGT GAGCATGACT GCCGGGTCGC TGCTGGTGAT CGCCGCGCTC 
GTGCTCGCGG TGACGGTCGT CTTCGATCCG GCGGCCGTCC TGGACGCGAT TAGCGGGGCG 
GACGGCGTCG TCGTCGCGTT CTCTGGCGTG GTGTACCTGC TGTCGTGGCC GCTGCGCGGA 
CAGCGCTATC GGGACATCCT CGCTCGGCTG GGCCACGACA GCGACACGTG GTTCCTCACG 
GGCGCGATCT TCATCAGTCA GACGGGGAAC CTCGTCTTTC CCGCCAGACT CGGCGACGGC 
GTCCGGGCGT ACGTCGTCAA GGCCCGCCGG CAGATCCCGT ATCCGACCGG GTTCGCCTCG 
CTGGCCGTCG AACGCGTCTT CGACCTGCTC GCGATCACGG TCCTGGCCGG GAGCGTCCTC 
GTCGGTCTCG TCGTCACCGG CGGGACCGAT CAGGTCGCCC AGGCGATCGC GGCCGACGTA 
CCCCCGGTGA CGATCGGAGA CGACACGCTC GATCCCGCCG CGGCGGCGCG GACGGCGCTC 
CGGGTCGCCG CCGTCGTCGG AGCAGCAGCG ATTGCCGGCG TCGCCGTGAT CGTCGTCAGC 
GCCCGCCGGG ACAGCGACCT CGTCCACCGT GCGGTCACCG CGCTCAGCAA CGACTCCTAC 
GCCCAGTACG TCTCCGGGAT CGTCGAGCAG TTCGTCGGCG ACGTCGAGAC CGTCGTCGCC 
GACCGGGGGG CCTTCCTCCG GGTCGGTGTC GGCAGCCTCG TCATCTGGAT CGTCGACGTG 
TTGACGGCGG TCGTCGTCTT CGCTGCCTTC CCCAGCATCG AGCTCTCGCC GTCGCTGGTG 
GCAGCCGCGT TCTTCGCGGT CAGCGTCGGT AACCTCGCGA AGATCCTCCC GCTGTCGCCG 
GGCGGGATCG GCCTCTACGA GGGTGCCTTT ACCCTCATCG TCGTCGGGCT GACGACCGTT 
ACGGGGCCGG TCGCACTCGC GATCTCGATC GTCGATCACG CCGTCAAAAA CGCCGTCACG 
ATCGTCGGCG GCCTGGGATC GATGGCCTGG CTCAACGTCT CGCTGACGAC CGCGGTCGAA 
GAGTCCCAGC AGTCCGGCGA AATCGAGCCG GAGGCCGACT AG

Protein sequence

MSDVEVSVVL PAYNEAATIE ETVETTLSTL AAFLPAGSFE VIVAEDGCED RTPEIATRMA 
DADERVRHVH SDERLGRGGA LSYAFRQAEG ETLVYFDTDL ATDMRHLEEL VESVRSGEYD 
VATGSRWLPE NRADRPAKRG VPSLGYNTLV RLFLRSDLQD HQCGFKAFDR AAALDLLDEV 
EDEHWFWDTE LLVRAQREGY RVKEFPVDWT PKGDSKVDLV RDVFGMGSQI VRTWWQLSVS 
PRITRKVSMT AGSLLVIAAL VLAVTVVFDP AAVLDAISGA DGVVVAFSGV VYLLSWPLRG 
QRYRDILARL GHDSDTWFLT GAIFISQTGN LVFPARLGDG VRAYVVKARR QIPYPTGFAS 
LAVERVFDLL AITVLAGSVL VGLVVTGGTD QVAQAIAADV PPVTIGDDTL DPAAAARTAL 
RVAAVVGAAA IAGVAVIVVS ARRDSDLVHR AVTALSNDSY AQYVSGIVEQ FVGDVETVVA 
DRGAFLRVGV GSLVIWIVDV LTAVVVFAAF PSIELSPSLV AAAFFAVSVG NLAKILPLSP 
GGIGLYEGAF TLIVVGLTTV TGPVALAISI VDHAVKNAVT IVGGLGSMAW LNVSLTTAVE 
ESQQSGEIEP EAD