Gene Hmuk_2020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2020
Symbol
ID	8411551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1923262
End bp	1925187
Gene Length	1926 bp
Protein Length	641 aa
Translation table	11
GC content	69%
IMG OID	645020354
Product	hypothetical protein
Protein accession	YP_003177840
Protein GI	257388067
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.356882
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGCG CGACGCCCCG CGAGCGACTC CCGGCGGAGC CGGACCTCCT CGTGGGGCTC 
GCCGGCCTCG CGGTCGCGGT CGTCCTCTTC CCGCTTCGAT TCCTCTCCGG ACAGCTGTTC 
ATCCAGGTCC TCCCACCGGT GCTGGGCCTC GGGAGCCTGG TGTATCTCGT CGGACGCGTC 
CGTGCTGGCG AGTCCGAGCG CGCGATCGAG CGCCGACGCG TCGGCGTCGA CGGGCGTGTC 
GTCGCGGGCC TCACGGCGCT TGGGATCGGC GGGCTCGCGC TGTTTGGCGC GAGTGCCGGC 
GGTCGGACGA CGGCGTTCCT GCTGGCCAGC GGGCTCGTCG GGACCGCGAT CCTCGCACAG 
ATCCTGTTTC TCGACGACGA CGCACTCGAT CCCGGACTCG TGTTGGGCCA GTTGCTCGCG 
CTGGCGCTCG TCGTCAGGTT CACCGCGTTG CTCTCGACGC CCGGACTGAT CGGCGTCGAC 
AGCTGGACGC ACCTCACGGA CTACGCGGCG GCCATCCAGT CGACGGACTC GCTGTCGGCG 
ATCGCCGACG TGAAGTACCG GACTGCGCCG CTCTTTCACG TCCTGGTGGT GATCGCGGCC 
GACGCCATCG GTGTCGGCCT GCGAGCGGCC ACCTACGTCT CGATGGGGCT CGCGCTCCCG 
CTGTCGACGC TGCTGGTGTA CGCGATCGGG ACGCTGCTGT TCGACCGCCG CTGGGCGTTG 
CTGGCAGCGG GCCTGTTCGT GATGGCCGAT CACGTGATCC GGTGGGGCGT CCACATCATC 
CCGACCAGCA TGGGGCTGGT CTTCTTCCTC GGAGCGCTGG CCGGAGCGAC GCGGCTCCTC 
GCTGGCGACA CCAGACGCGC CACGTACGCG ATCGTCGTGG CGTTCGGGAT CGCGACCGCG 
CTGACCCACC AGATCTCGGC GTTCATCCTG CTGGTGGTGC TGGGCGTCGG TGCCGTGGTG 
GGGTCGCTCG GATCGGTGCT GCCCGGCGAC TTCGACCGCG CGGGGTCGCT GTGGCCGGTC 
TTCGCGCTCG TCACCGCCTT CGTGGCAGCG CTCTGGTCGA TCACGCCGTA CCGAGACAGC 
GTGTTCGCCC TGGAACTGCT CGACACCGTC GACCGGGCGA TCGCGACCTC CGTCGGCTTC 
CTCAACCTCG CCGGGTCGGA TCCGGGCGGC GCGGGCGGTG CCAGCAGCGC TGCGGGCGTC 
CCGATCGACG TCGCCTTCGC GGACGCGCTC GGCTTCTTCG CGCTGTTTTT CGCGGTCGTG 
ATCGGGACCG TCGCCGTCTT CCGCCGACGC AACGCCACTC CGGCGACGGT GACCTACGCC 
GCGGCCGCGG TGGTGCTGGC GACGTTTACC TTCGGACTCC CGCTGTTTGG CTTTACGACC 
TTCCTGCCCG GCCGCTGGTA CGCGTTCATG TACGTCCCGA TGGCGCTGCT CGCGGCGCTT 
GGCTGCCGGT TCGCGGTGCG CCGGCTCTCG CCACGGATGG CGATGACCGG CCTGCTCGTG 
TTCGCGCTGG TGGTCCCCGG TGCGATGGCG ATCAACCACA AGGGGACCCC GGACAGCCCG 
GTCTTCGACC AGGAGTACTC GACCTACGCC TACGACGAGA CGGAGCTGTC GGCCGTCGAG 
ACGGTCGGAG CGACGCGGCC CGAAGTGGCC GATCCGGTCT ACACCGACCA CCCCTATCGG 
ACGGTGTTCG AGCGCAGCGG TGCGACGCCG GCCAACATGC TGGCCGTCGA GGACGGCGAG 
ATCTACCACG ACACCGTCGT CTACCGGAAG TACCAGTCGA CCGGCGCGCC GGTGCTCCTC 
GTCGACAACG AGTCGCGGAC GCGCAGGGTC GCACCCTCGG AGGTGTGTCG CGAGGATATG 
CACCGGCTCT ACGCGAACAG CAACGTCACC GTCTGTACCG GTATCGACGG GATAGACGGA 
GCATAA

Protein sequence

MASATPRERL PAEPDLLVGL AGLAVAVVLF PLRFLSGQLF IQVLPPVLGL GSLVYLVGRV 
RAGESERAIE RRRVGVDGRV VAGLTALGIG GLALFGASAG GRTTAFLLAS GLVGTAILAQ 
ILFLDDDALD PGLVLGQLLA LALVVRFTAL LSTPGLIGVD SWTHLTDYAA AIQSTDSLSA 
IADVKYRTAP LFHVLVVIAA DAIGVGLRAA TYVSMGLALP LSTLLVYAIG TLLFDRRWAL 
LAAGLFVMAD HVIRWGVHII PTSMGLVFFL GALAGATRLL AGDTRRATYA IVVAFGIATA 
LTHQISAFIL LVVLGVGAVV GSLGSVLPGD FDRAGSLWPV FALVTAFVAA LWSITPYRDS 
VFALELLDTV DRAIATSVGF LNLAGSDPGG AGGASSAAGV PIDVAFADAL GFFALFFAVV 
IGTVAVFRRR NATPATVTYA AAAVVLATFT FGLPLFGFTT FLPGRWYAFM YVPMALLAAL 
GCRFAVRRLS PRMAMTGLLV FALVVPGAMA INHKGTPDSP VFDQEYSTYA YDETELSAVE 
TVGATRPEVA DPVYTDHPYR TVFERSGATP ANMLAVEDGE IYHDTVVYRK YQSTGAPVLL 
VDNESRTRRV APSEVCREDM HRLYANSNVT VCTGIDGIDG A