Gene Mjls_4699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4699
Symbol	purH
ID	4880398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4939733
End bp	4941316
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	70%
IMG OID	640142004
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001072955
Protein GI	126437264
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGTG ACCAAGGGCA GGCCGGGGCG AAGAGGCCGA TCCGGCGCGC ACTGATCAGC 
GTCTACGACA AGAGCGGGCT GATCGACCTG GCGCGCGGAC TGCACGAGGC CGGCGTCGAC 
ATCGTGTCGA CCGGCTCCAC CGCGAAAACC ATTGCCGACA AAGGCATTCC GGTCACACCT 
GTCGAATTCG TGACCGGGTT CCCCGAAGTG CTCGACGGCC GCGTCAAGAC GCTGCATCCG 
CACATCCACG CCGGCCTGCT CGCCGACACC CGTAAACCCG AGCACGTCGA GGCGCTGGCG 
AAACTCGGCA TCGCGCCGTT CGACCTCGTG GTGGTCAACC TCTACCCGTT CAGCGAGACC 
GTCGAATCCG GCGCGTCGGT CGACGAGTGC GTGGAGCAGA TCGACATCGG CGGCCCGTCG 
ATGGTGCGCG CGGCCGCCAA GAACCACCCG AGCGTGGCGG TGGTCGTCGA ACCGAACGGG 
TACGACGGTG TGCTGGCCGC GGTCCGGACC GGCGGCTTCA CGCTTGCCGA ACGAAAGATC 
CTGGCGTCGT TGGCATTCCG GCACACCGCC GAATACGACG TGGCGGTGGC GTCGTGGATG 
GGTTCGACGC TGGCGCCCGA GGAGCCCGCG CAGAAGCTGC CCGCCTGGGT GGGCGGCACC 
TGGCGGCGTG CCGCGGTACT GCGCTACGGC GAGAACCCCC ATCAGCAGGC GGCGCTCTAC 
CGCGACGCCA CCGCGTGGCC GGGGCTGGCG CAGGCCGAGC AGTTGCACGG CAAGGAGATG 
TCGTACAACA ACTACACCGA CGCCGATGCG GCGTGGCGGG CGGCGTTCGA CCACGAGGAG 
ATCTGCGTCG CGATCATCAA GCACGCCAAC CCGTGCGGTA TCGCGATCTC GTCGGTGTCG 
GTCGCCGACG CGCACCGCAA GGCCCACGAA TGTGACCCGC TGTCGGCGTT CGGCGGGGTG 
ATCGCGACGA ACAGCTCCGT GAGCGTCGAG ATGGCCGAGA CCGTCGCCGA CATCTTCACC 
GAGGTCATCG TCGCCCCGGC CTACGAGCCC GGCGCCGTCG AGATCCTGTC CCGCAAGAAG 
AACATCCGCA TCCTGTTGGC GGCGCAACCG CCGACCACCG GCACCGAACT CCGGCCGATC 
AGCGGCGGTC TGCTGCTGCA GCAGCGCGAT GCGCTCGACG CCGACGGCGA CGACCCGGTC 
AACTGGACCC TCGCGACGGG TGAGCCCGCC GATCCGGCGA CGCTGGCCAA CTTGAAGTTC 
GCCTGGCGCA GCTGCCGCGC CGTGAAGTCC AACGCCATCG TCGTGGTCGC CGACGGCGCC 
ACCGTGGGCG TCGGGATGGG GCAGGTCAAC CGCGTCGACG CGGCGCGGCT GGCGGTGCAG 
CGGGCCGGTG ACCGGGTGCG CGGCGCGATC GCGGCGTCGG ATGCGTTCTT CCCGTTCCCC 
GACGGGCTGG AGACGCTCAC CGAGGCGGGG GTGAAGGCGA TCGTGCACCC CGGCGGATCC 
ATGCGCGACG ACGTGGTGAC CGAGGCGGCG GCCAAGGCCG GTATCTCGCT CTACCTGACC 
GGCGCGCGGC ACTTCGCGCA CTGA

Protein sequence

MSGDQGQAGA KRPIRRALIS VYDKSGLIDL ARGLHEAGVD IVSTGSTAKT IADKGIPVTP 
VEFVTGFPEV LDGRVKTLHP HIHAGLLADT RKPEHVEALA KLGIAPFDLV VVNLYPFSET 
VESGASVDEC VEQIDIGGPS MVRAAAKNHP SVAVVVEPNG YDGVLAAVRT GGFTLAERKI 
LASLAFRHTA EYDVAVASWM GSTLAPEEPA QKLPAWVGGT WRRAAVLRYG ENPHQQAALY 
RDATAWPGLA QAEQLHGKEM SYNNYTDADA AWRAAFDHEE ICVAIIKHAN PCGIAISSVS 
VADAHRKAHE CDPLSAFGGV IATNSSVSVE MAETVADIFT EVIVAPAYEP GAVEILSRKK 
NIRILLAAQP PTTGTELRPI SGGLLLQQRD ALDADGDDPV NWTLATGEPA DPATLANLKF 
AWRSCRAVKS NAIVVVADGA TVGVGMGQVN RVDAARLAVQ RAGDRVRGAI AASDAFFPFP 
DGLETLTEAG VKAIVHPGGS MRDDVVTEAA AKAGISLYLT GARHFAH