Gene BamMC406_0610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BamMC406_0610
Symbol	purH
ID	6177943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia ambifaria MC40-6
Kingdom	Bacteria
Replicon accession	NC_010551
Strand	-
Start bp	686319
End bp	687884
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	67%
IMG OID	641680358
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001807323
Protein GI	172059671
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.951228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.279266
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGC AAGCGCTCAT TTCCGTTTCC GACAAGACCG GCATCGTCGA CTTCGCGAAG 
TCGCTGTCCG ACCTCGGCGT CAAGCTGCTG TCGACCGGCG GCACCGCGAA ACTCCTCGCC 
GACGCGGGCC TGCCCGTTAC CGAAGTGGCT GATTACACGG GCTTTCCGGA AATGCTCGAT 
GGGCGCGTGA AGACGCTCCA CCCGAAGGTG CACGGCGGCA TCCTCGCCCG CCGCGACCTG 
CCCGAGCACA TGCAGGCGCT GGAGCAGCAC GACATCCCGA CGATCGACCT GCTGGTCGTG 
AACCTGTATC CGTTCGTCGC GACGATCGCG AAGGACGACT GCACGCTCGC CGACGCGATC 
GAGAACATCG ACATCGGCGG CCCGACGATG CTGCGCTCGG CCGCGAAGAA CCACCGTGAC 
GTGACGGTCG TGGTCGATCC GGCCGACTAC GCGGTCGTGC TCGACGAAAT GAAGGCGAAC 
GGCAACGCGA TCGGCTACGC GACCAACTTC CGCCTCGCGA CGAAGGTGTT CGCGCACACC 
GCGCAGTACG ACGGCGCGAT CACGAACTAC CTGACGAGCC TGACCGACGA GCTGCAGCAC 
GCGTCGCGCA GCGCGTACCC GGCGACGCTG AACATGGCGT TCGACAAGGT GCAGGACCTG 
CGCTACGGCG AGAACCCGCA CCAGAGCGCC GCGTTCTACC GCGACCTCGC GGCGCCGGCC 
GGGGCACTGG CGAACTACCG CCAGCTGCAG GGCAAGGAGC TGTCGTACAA CAACATCGCG 
GATTCGGACG CGGCGTGGGA ATGCGTGAAG ACGTTCGACG CGCCGGCCTG CGTGATCATC 
AAGCATGCGA ACCCGTGCGG CGTCGCGGTC GGCAACGACT CGGCCGACGC ATACGCGAAG 
GCATTCCAGA CCGACCCGAC GTCGGCGTTC GGCGGCATCA TCGCGTTCAA CCGCGAAGTC 
GACGAGGCGG CCGCGCAGGC GGTGGCGAAG CAGTTCGTCG AAGTGCTGAT CGCGCCGTCG 
TTCTCCGACG CCGCGAAGCA GGTGTTCGCC GCGAAGCAGA ACGTGCGCCT GCTCGAGATC 
GCGCTGGGTG ACGGCCATAA CGCCTTCGAC CTGAAGCGCG TGGGCGGCGG CCTGCTCGTG 
CAGTCGCTCG ATTCGAAGAA CGTGCAGCCG AGCGAGCTGC GCGTCGTCAC GAAGCGCCAG 
CCGAGCGCGA AGGAAATGGA TGACCTGCTG TTCGCATGGC GCGTCGCGAA GTACGTGAAG 
TCGAACGCGA TCGTGTTCTG CGGCAACGGC ATGACGCTCG GCGTCGGCGC AGGCCAGATG 
AGCCGCGTCG ATTCCGCGCG CATCGCGAGC ATCAAGGCGC AGAACGCGGG CCTGACGCTG 
GCTGGCTCGG CCGTCGCGTC GGATGCGTTC TTCCCGTTCC GCGACGGTCT CGACGTCGTC 
GTGGCGGCAG GCGCGACCTG CGTGATCCAG CCGGGCGGTT CGATGCGCGA CGACGAAGTG 
ATCGCGGCAG CGGACGAGCA CGGCATCGCG ATGATCCTGA CGGGCGTGCG TCACTTCCGT 
CACTGA

Protein sequence

MIKQALISVS DKTGIVDFAK SLSDLGVKLL STGGTAKLLA DAGLPVTEVA DYTGFPEMLD 
GRVKTLHPKV HGGILARRDL PEHMQALEQH DIPTIDLLVV NLYPFVATIA KDDCTLADAI 
ENIDIGGPTM LRSAAKNHRD VTVVVDPADY AVVLDEMKAN GNAIGYATNF RLATKVFAHT 
AQYDGAITNY LTSLTDELQH ASRSAYPATL NMAFDKVQDL RYGENPHQSA AFYRDLAAPA 
GALANYRQLQ GKELSYNNIA DSDAAWECVK TFDAPACVII KHANPCGVAV GNDSADAYAK 
AFQTDPTSAF GGIIAFNREV DEAAAQAVAK QFVEVLIAPS FSDAAKQVFA AKQNVRLLEI 
ALGDGHNAFD LKRVGGGLLV QSLDSKNVQP SELRVVTKRQ PSAKEMDDLL FAWRVAKYVK 
SNAIVFCGNG MTLGVGAGQM SRVDSARIAS IKAQNAGLTL AGSAVASDAF FPFRDGLDVV 
VAAGATCVIQ PGGSMRDDEV IAAADEHGIA MILTGVRHFR H