Gene Dtpsy_2907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_2907
Symbol	purH
ID	7384092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	3093251
End bp	3094852
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	68%
IMG OID	643656217
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002554341
Protein GI	222112077
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAC TCCTTTCCGT CTCCGACAAG ACCGGCATCG TCGAATTTGC CCAGGCACTG 
CATGCGCTGG GCATCCGCCT GCTGTCCACC GGCGGCACCG CCAAGCTGCT GGCCGAGAGC 
GGCCTGCCCG TCACCGAGGT GGCCGAGGTC ACGCAGTTCC CCGAGATGCT GGACGGCCGC 
GTGAAGACGC TGCACCCCAA GGTGCATGGC GGCCTGCTGG CGCGCCGCGA GCTGCCTGCG 
CACATGGCGG CGCTGAAGGA GCACGGCATC GACACCATCG ATCTGCTGGT GGTCAACCTG 
TACCCGTTCG AGGCCACGGT GGCCAAGGCC GGCTGCACGC TGGCCGACGC CATCGAGAAC 
ATCGACATCG GCGGCCCCGC CATGGTGCGC AGCGCCGCCA AGAACTGGAA GGACGTGGGC 
GTGGTCACCT CGGCTGACCA GTACGAGGCG GTGCTGGGCG AGTTGAAGGC CGCGGGCAAG 
CTGTCCGACA AGCTGCGCTT CACGCTGTCG GTGGCGGCGT TCAACCGCAT CGCGCAGTAC 
GACGGCGCCA TCAGCGACTA CCTGTCGTCC ATCCAGTTCG ACGAGGCCAA GCTGTCCGAG 
AGCTACGTGC CCGAACGCGC GCTGTTCCCC GGCCAGAGCA ACGGCATCTT CACCAAGATC 
CAGGACCTGC GCTACGGCGA GAACAGCCAC CAGCAGGCCG CGCTGTACCG CGACCTGCAC 
CCTGCGCCCG GCTCCATCGT CACCGGCGTG CAGCTGCAGG GCAAGGAACT CTCGTACAAC 
AACATCGCCG ACGCCGACGC CGCCTGGGAA TGCGTCAAGA GCTTCAAGCT GCCGGCCTGC 
GTGATCGTCA AGCACGCCAA CCCCTGCGGC GTGGCCGTGG GCACGAGCGC GCTGGAGGCC 
TACAGCAAGG CCTTCCAGAC CGACCCGACG AGCGCCTTCG GCGGCATCAT CGCGCTGAAC 
CGCCCCGTGG ACGGCGCGGC CGCGCAGCAG ATCGCCAAGC AGTTCGTCGA AGTGCTGATG 
GCGCCCGACT TCACGCCCGA GGCGCTGGAG GTGTTCAAGG CCAAGGCCAA CGTGCGCCTG 
ATGAAGATCG CGTTGCCTGC CTCCGGCGGT GCCACGGCGT GGGAGCAGGG GCGCAACCTG 
ATGGACGCCA AGCGCGTGGG CTCGGGCCTG CTGCTGCAGA CGGCCGACAA CCATGAGCTG 
CAACTGCCCG ATGTGAAGGT GGTGACCCTC AAGCAGCCCA CGCAGGAAGA GATGCAGGAC 
CTGCTGTTCG CCTGGAAGGT GGCCAAGTAC GTCAAGAGCA ACGCCATCGT GTTCGTGAAG 
GGCGGCATGA CCATGGGCGT GGGTGCTGGC CAGATGAGCC GGCTGGATTC GGCGCGCATC 
GCCAGCATCA AGGCGCAGGC CGCGGGCCTG TCCCTGCAGA ACACCGTGGT GGCCAGCGAC 
GCCTTCTTCC CGTTCCGCGA TGGGCTGGAC GTGGTGGTCG ACGCGGGCGC GACCTGCGTG 
GCTCAGCCCG GCGGCTCCAT GCGCGACCAG GAGGTCATCG ACGCGGCCAA CGAGCGCGGC 
GTGGCCATGG TCTTCACGGG CGTGCGCCAC TTCCGTCACT GA

Protein sequence

MNALLSVSDK TGIVEFAQAL HALGIRLLST GGTAKLLAES GLPVTEVAEV TQFPEMLDGR 
VKTLHPKVHG GLLARRELPA HMAALKEHGI DTIDLLVVNL YPFEATVAKA GCTLADAIEN 
IDIGGPAMVR SAAKNWKDVG VVTSADQYEA VLGELKAAGK LSDKLRFTLS VAAFNRIAQY 
DGAISDYLSS IQFDEAKLSE SYVPERALFP GQSNGIFTKI QDLRYGENSH QQAALYRDLH 
PAPGSIVTGV QLQGKELSYN NIADADAAWE CVKSFKLPAC VIVKHANPCG VAVGTSALEA 
YSKAFQTDPT SAFGGIIALN RPVDGAAAQQ IAKQFVEVLM APDFTPEALE VFKAKANVRL 
MKIALPASGG ATAWEQGRNL MDAKRVGSGL LLQTADNHEL QLPDVKVVTL KQPTQEEMQD 
LLFAWKVAKY VKSNAIVFVK GGMTMGVGAG QMSRLDSARI ASIKAQAAGL SLQNTVVASD 
AFFPFRDGLD VVVDAGATCV AQPGGSMRDQ EVIDAANERG VAMVFTGVRH FRH