Gene Hmuk_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2022
Symbol
ID	8411553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1926111
End bp	1927169
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	69%
IMG OID	645020356
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_003177842
Protein GI	257388069
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0549776
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.843248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGTCC TCACCGTCGT CGGCGCGCGT CCACAGTTCG TCAAGTCGTT CCCCGTCTCG 
CGTGCGCTCG CACCCGACCA CGAGGAGGTG CTCGTACACA CCGGCCAGCA CTACGACGAA 
GAGCTGTCGG CGGTGTTCTT CGACGACCTG GATCTGGACC AGCCCGACTA CAACCTCGGA 
GTGGGCTCGC ACACCCACGC GGTCCAGACC GCCCAGATCA TGGAACGACT GGACCCGATC 
GTCGCCAGGG AAGCGCCCGA CGTACTGCTG TTGTACGGCG ATACGAACTC GACGGTTGCC 
GGAGCGCTCG TCGGGGCCAA CCGAGACGTG ACGGTCGCTC ACGTCGAGGC CGGACTGCGG 
AGCGGGACGC GATCGATGCC CGAAGAGACC AACCGCATCG TCACGGATCA CGTCGCCGAC 
GTGCTCTGTA CGCCCTGCCG GGCGGCGACC GAGACGCTCG AACGGGAGGG GCTGGGTGAT 
CGGGTCCACG AGACCGGCGA CGTGATGTAC GACGCGCTCC GCTGGGCCGA GCGGATCGCG 
CGCGACGAGT CGGCCGTCCT CGATCGGCTC GGGCTCGACG AGTCGTTCGT CCTCGCGACG 
GTACACCGGC CCCGCAACAC CGACGATCCC GACCGCCTCG CCGCCATCGT GGAGGCGCTG 
GTGACCCACC CCGCGCCGGT CGTCTTTCCG GTTCACCCCC GGACTGCGGC CGCGCTCCGA 
GATCAGGGGC TGTTCGAGAC GGTCCAGTCC GAACTGCACT GTATCGACCC CGTCGGCTAC 
CTGGATTTCG TCCGCCTGCT CGACGCCGCC GATCGGGTGG TCACCGACTC CGGGGGCGTC 
CAGAAGGAGG CGTTCTTCCT CGAAACGCCC TGCGTGACGT TGCGCGAGGA GACCGAGTGG 
GACGAGACGG TCGCCGAGGG GTGGAACAGG CTCGTCGGCG CACGGACGAC GGCGATCCGC 
GACGCGCTGG CGACGCCGGT CGACGCCACC GACAGGGGCC ACCCCTACGG CGACGGCGAC 
GCGGCCGAGC GCGTCGTCGA GGTGATCGCC GATGGGTGA

Protein sequence

MRVLTVVGAR PQFVKSFPVS RALAPDHEEV LVHTGQHYDE ELSAVFFDDL DLDQPDYNLG 
VGSHTHAVQT AQIMERLDPI VAREAPDVLL LYGDTNSTVA GALVGANRDV TVAHVEAGLR 
SGTRSMPEET NRIVTDHVAD VLCTPCRAAT ETLEREGLGD RVHETGDVMY DALRWAERIA 
RDESAVLDRL GLDESFVLAT VHRPRNTDDP DRLAAIVEAL VTHPAPVVFP VHPRTAAALR 
DQGLFETVQS ELHCIDPVGY LDFVRLLDAA DRVVTDSGGV QKEAFFLETP CVTLREETEW 
DETVAEGWNR LVGARTTAIR DALATPVDAT DRGHPYGDGD AAERVVEVIA DG