Gene Hmuk_3155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3155
Symbol
ID	8412708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	3045433
End bp	3047043
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	68%
IMG OID	645021502
Product	phosphoribosylglycinamide formyltransferase
Protein accession	YP_003178967
Protein GI	257389194
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase [TIGR00639] phosphoribosylglycinamide formyltransferase, formyltetrahydrofolate-dependent

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.262908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCG CCGGTCTGGC CAGCAACCGT GGCCGCAACC TGATGAACGT CGCCGACCGC 
GCGCCCGGTG GAGCGGAGCT CGCGGTCGTG CTCACGAACG ACGCCGACGC GCCCGTCATA 
GAGGCCGCCG CCGAGCGCGA CATTCCCACC GAGGTCGTCG AGCGCCCCGA CGACCAGGAG 
CGGGAAGCCC ACGAACTGCG CGTGCTGGAC GCCATCGAGG AGTACGACTT CGATCTGGTC 
TGTCTGGACG GCTACATGCG AGTCCTCACG GAGACGTTCC TCGACGAGGT GCCCACGACG 
CTGAACGTCC ACCCGTCGCT GCTGCCCGCC TTCCCGGGCA TGGACGCCCA CGAGCAGGTG 
CTCGACGCCG GAGTCAAGAC CACCGGCTGT ACCGTCCACG TCGTCGACGA GGAGGTCGAC 
GACGGCCCGA TCGTCACGCA GGAACCGATC CCGGTGTACG ACGGCGACGA CGTGGCCGAC 
CTCAAAGAGC GCGTCCTCTA CGAGGGCGAG TTCACTGCGT ATCCGCGCGC GATCGAGTGG 
TTCGCAGAGG ACCGCGTCAC CGTCGACTGG GACGCCCACA GCGTCACCGT CGAGGGCGAC 
GACGGCGGTC CGTTCCCCGC GCGCCGGCTC GTCAGCAACG ACCGCACCGC CGACCTGCGC 
TACGGGGAGA ACCCGCATCA GGACGCCGCG GTGTACGCCG ACCGGACGAC CGAAGAGGCC 
AGCGTCGTCC ACGCCGACCA GCTCAACGAG GGCGCGAAGG CACTCAGCTA CAACAACTAC 
AACGACGCCG ACGGAGCCCT GAATCTGATC AAGGAGTTCG ACGAGCCGGC CGCCGCCGTC 
ATCAAGCACA CCAATCCCGC CGGCTGTGCG ACCGCCGACT CCGTCGCCGA GGCCTACGAG 
CGGGCCCTCT CGACGGACCC CCAGAGCGCC TTCGGCGGCA TCGTCGCGCT GAACCGCGAG 
TGCGACGTTG CCACGGCCGA GCAGATCGTC GACTCCTTCA AGGAGATCGT CGTCGCGCCG 
GGCTACACCG ACGACGCGCT CGACGTGCTC TTCCAGAAGG AGAACCTGCG CGTGCTGGAC 
GTTGGAGACG GCCGGACGGG CGAGTCCGGC CGGCCGGAAA ACTACGACGT GACCGAGCCG 
ATCACGGAGA AACCACTCGT CGGCGGCCGC CTCGTCCAGG AGCGGGACAC CCAGCACCTC 
ACGGCCGACG ACCTCGAAGT CGTCACCGAC CGCGAGCCCA CCGACGAGCA GATCGAGTCG 
ATGCTGTTCG CCTGGCACAC GCTCAAGCAC GTGAAATCGA ACGGCATCCT CTTTGCCAAG 
GGCACGGAGA CGGTCGGCAT CGGGATGGGC CAGGTCTCTC GGGTCGACGC CGTCCGCCTC 
GCCGCGATGA AGGCCGACGA GCACGCCCAG GGCAAGGACG CCGACGGCGC GGTCATGGCG 
AGCGACGCCT TCTTCCCGTT CCCGGACGGC CTCGAAGCCG CCGCCGAGGC GGGCATCGAG 
GCGGTCATCC AGCCGGGCGG CTCGAAGAAC GACGACATGG TCATCGAGGC CGCGAACGAA 
CACGACGTGG CGATGGTCCT TACCGGCCAG CGGTCGTTCC GACACGACTG A

Protein sequence

MKIAGLASNR GRNLMNVADR APGGAELAVV LTNDADAPVI EAAAERDIPT EVVERPDDQE 
REAHELRVLD AIEEYDFDLV CLDGYMRVLT ETFLDEVPTT LNVHPSLLPA FPGMDAHEQV 
LDAGVKTTGC TVHVVDEEVD DGPIVTQEPI PVYDGDDVAD LKERVLYEGE FTAYPRAIEW 
FAEDRVTVDW DAHSVTVEGD DGGPFPARRL VSNDRTADLR YGENPHQDAA VYADRTTEEA 
SVVHADQLNE GAKALSYNNY NDADGALNLI KEFDEPAAAV IKHTNPAGCA TADSVAEAYE 
RALSTDPQSA FGGIVALNRE CDVATAEQIV DSFKEIVVAP GYTDDALDVL FQKENLRVLD 
VGDGRTGESG RPENYDVTEP ITEKPLVGGR LVQERDTQHL TADDLEVVTD REPTDEQIES 
MLFAWHTLKH VKSNGILFAK GTETVGIGMG QVSRVDAVRL AAMKADEHAQ GKDADGAVMA 
SDAFFPFPDG LEAAAEAGIE AVIQPGGSKN DDMVIEAANE HDVAMVLTGQ RSFRHD