Gene Ajs_3584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ajs_3584
Symbol	purH
ID	4672846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax sp. JS42
Kingdom	Bacteria
Replicon accession	NC_008782
Strand	-
Start bp	3781361
End bp	3782962
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	68%
IMG OID	639840616
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_987772
Protein GI	121595876
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.390461
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAC TCCTTTCCGT CTCCGACAAG ACCGGCATCG TCGAATTTGC CCAGGCGCTG 
CATGCGCTGG GCATCCGCCT GCTGTCCACC GGCGGCACCG CCAAGCTGCT GGCCGAGAGC 
GGCCTGCCCG TCACCGAGGT GGCCGAGGTC ACGCAGTTCC CCGAGATGCT GGACGGCCGC 
GTGAAGACGC TGCACCCCAA GGTGCATGGC GGCCTGCTGG CGCGCCGCGA GCTGCCTGCG 
CACATGGCGG CGCTGAAGGA GCACGGCATC GACACCATCG ACCTGCTGGT GGTCAACCTG 
TACCCGTTCG AGGCCACGGT GGCCAACGCC GGCTGCACGC TGGCCGACGC CATCGAGAAC 
ATCGACATCG GCGGCCCCGC CATGGTGCGC AGCGCCGCCA AGAACTGGAA GGACGTGGGC 
GTGGTCACCT CGGCCGACCA GTACGACGCG GTGCTGGGCG AGTTGAAGGC CGCGGGCAAG 
CTGTCCGACA AGCTGCGCTT CGCGCTGTCG GTGGCGGCGT TCAACCGCAT CGCGCAGTAC 
GACGGCGCCA TCAGCGACTA CCTGTCGTCC ATCCAGTTCG ACGAGGCCAA GCTGTCCGAG 
AGCTACGTGC CCGAACGCGC GCTGTTTCCC GGCCAGAGCA ACGGCATCTT CACCAAGATC 
CAGGACCTGC GCTACGGCGA GAACAGCCAC CAGCAGGCCG CGCTGTACCG CGACCTGCAC 
CCCGCGCCCG GCTCCATCGT CACCGGCGTG CAGCTGCAGG GCAAGGAACT CTCATACAAC 
AACATCGCCG ACGCCGACGC GGCCTGGGAA TGCGTCAAGA GCTTCAAGCT GCCGGCCTGC 
GTGATCGTCA AGCATGCCAA CCCCTGCGGC GTGGCCGTGG GCACGAGCGC GCTGGAGGCC 
TACAGCAAGG CCTTCCAGAC CGACCCGACG AGCGCCTTCG GCGGCATCAT CGCGCTGAAC 
CGCCCCGTGG ACGGCGCGGC CGCGCAGCAG ATCGCCAAGC AGTTCGTCGA AGTGCTGATG 
GCGCCCGACT TCACGCCCGA GGCGCTGGAG GTGTTCAAGG CCAAGGCCAA CGTGCGCCTG 
ATGAAGATCG CGTTGCCTGC CTCCGGCGGT GCCACGGCGT GGGAGCAGGG CCGCAACCTG 
ATGGACGCCA AGCGCGTGGG CTCGGGCCTG CTGCTGCAGA CGGCCGACAA CCATGAGCTG 
CAACTGCCCG ATGTGAAGGT GGTGACCCTC AAGCAGCCCA CGCAGGAAGA GATGCAGGAC 
CTGATGTTCG CCTGGAAGGT GGCCAAGTAC GTCAAGAGCA ACGCCATCGT GTTCGTGAAG 
GGCGGCATGA CCATGGGCGT GGGTGCGGGC CAGATGAGCC GGCTGGATTC GGCGCGCATC 
GCCAGCATCA AGGCGCAGGC CGCGGGCCTG TCCCTGCAGA ACACCGTGGT GGCCAGCGAC 
GCCTTCTTCC CGTTCCGCGA TGGGCTGGAC GTGGTGGTCG ACGCGGGCGC GACCTGCGTG 
GCCCAGCCCG GTGGTTCCAT GCGCGACCAG GAGGTCATCG ACGCGGCCAA CGAGCGCGGC 
GTGGCCATGG TCTTCACGGG CGTGCGCCAC TTCCGTCACT GA

Protein sequence

MNALLSVSDK TGIVEFAQAL HALGIRLLST GGTAKLLAES GLPVTEVAEV TQFPEMLDGR 
VKTLHPKVHG GLLARRELPA HMAALKEHGI DTIDLLVVNL YPFEATVANA GCTLADAIEN 
IDIGGPAMVR SAAKNWKDVG VVTSADQYDA VLGELKAAGK LSDKLRFALS VAAFNRIAQY 
DGAISDYLSS IQFDEAKLSE SYVPERALFP GQSNGIFTKI QDLRYGENSH QQAALYRDLH 
PAPGSIVTGV QLQGKELSYN NIADADAAWE CVKSFKLPAC VIVKHANPCG VAVGTSALEA 
YSKAFQTDPT SAFGGIIALN RPVDGAAAQQ IAKQFVEVLM APDFTPEALE VFKAKANVRL 
MKIALPASGG ATAWEQGRNL MDAKRVGSGL LLQTADNHEL QLPDVKVVTL KQPTQEEMQD 
LMFAWKVAKY VKSNAIVFVK GGMTMGVGAG QMSRLDSARI ASIKAQAAGL SLQNTVVASD 
AFFPFRDGLD VVVDAGATCV AQPGGSMRDQ EVIDAANERG VAMVFTGVRH FRH