Gene Dd1591_3861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dd1591_3861
Symbol	purH
ID	8118818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dickeya zeae Ech1591
Kingdom	Bacteria
Replicon accession	NC_012912
Strand	+
Start bp	4366117
End bp	4367706
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	56%
IMG OID	644854232
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_003006140
Protein GI	251791419
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000584641
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACAAC GTCGTCCTAT CCGTCGTGCT TTGCTCAGCG TATCTGACAA AGCCGGTATC 
GTTGAATTCG CCCAGTCGCT GTCACAGCGT GGCATTGAAC TGCTCTCAAC CGGCGGTACT 
GCACGCCTGC TGGCCAATGC CGGGCTGCCG GTGACGGAGG TTTCCGATTA CACCGGTTTT 
CCTGAAATGA TGGATGGACG CGTCAAAACC CTGCATCCCA AAGTGCATGG CGGCATTCTG 
GGCCGTCGCG GTCAAGATGA TGCCGTTATG GCTCAGCATC ATATCCAGCC AATCGATATG 
GTGGTCGTTA ATCTCTACCC GTTCGCCCAA ACCGTCGCTA AAGCCGACTG TACGCTGGAA 
GACGCAGTGG AAAATATCGA TATCGGCGGC CCGACCATGG TGCGCTCCGC CGCCAAGAAC 
CATAATGACG TAGCTATTGT TGTTAAAAGC AGCGACTACA CGGCAATCAT CGAGGAGATG 
GATGCCAACG ACGGTTCTCT GACTTACGAA ACCCGTTTTG ATCTGGCTAT CAAGGCATTC 
GAGCATACCG CCGCTTACGA CAGCATGATC GCCAACTATT TCGGCAGCAA GGTTCCTGCT 
TATCACGGTG AAACGACTCA GCCCTCCGGT CGCTTCCCGC GCACGCTGAA TCTGAATTTC 
ATCAAAAAGC AGGATATGCG CTACGGCGAG AACAGCCATC AGCAAGCCGC CTTCTATATA 
GAAGAGACCG TCGCCGAGGC ATCGGTAGCG ACTGCCCAAC AACTGCAGGG CAAGGCACTT 
TCCTACAATA ACATCGCCGA TACCGACGCT GCGCTGGAGT GTGTGAAAGA GTTCGTTGAA 
CCGGCCTGCG TCATCGTTAA GCACGCCAAC CCTTGCGGTG TGGCGATCGG CGAGTCTATT 
CTGGACGCCT ATGAGCGCGC CTACAAAACC GACCCGACCT CAGCATTCGG CGGCATCATC 
GCCTTTAACC GCGAGTTGGA CGAAGCGACT GCGCAAGCCA TTATCAGCCG TCAGTTTGTC 
GAGGTGATCA TTGCTCCTTC CGCCAGCGAC GCTGCGCTGA AAGTTACCGC CGCCAAGCAG 
AACGTACGCG TACTGATCTG CGGTCAATGG CAACAACGTG CTCCCGGGCT GGATTTCAAA 
CGCGTCAACG GCGGCCTGCT GGTGCAGGAT CGCGATTTAG GTATGGTGGA CGCCGCTCAA 
CTGCGCGTGG TTACCGAGCG TCAGCCGACG GAAGCCGAGC TGCGCGATGC CCTGTTCTGC 
TGGAAAGTCG CGAAGTTCGT TAAATCCAAC GCGATTGTTT ATGCCCGCGA TAACATGACT 
ATCGGTATCG GCGCCGGTCA GATGAGCCGC GTTTACTCGG CCAAGATCGC AGGTATCAAG 
GCTGGCGACG AAGGGTTGGA AGTGAAAGGC TCCGTGATGG CATCCGACGC GTTTTTCCCG 
TTCCGTGATG GTATCGACGC CGCTGCCGCC GTTGGTATCA CTTGCGTCAT TCAGCCTGGC 
GGTTCTATTC GCGATGATGA AGTCATCGCC GCCGCCAACG AACACGGCAT TGCGATGTTG 
TTTACCGACA TGCGTCACTT CCGTCACTAA

Protein sequence

MQQRRPIRRA LLSVSDKAGI VEFAQSLSQR GIELLSTGGT ARLLANAGLP VTEVSDYTGF 
PEMMDGRVKT LHPKVHGGIL GRRGQDDAVM AQHHIQPIDM VVVNLYPFAQ TVAKADCTLE 
DAVENIDIGG PTMVRSAAKN HNDVAIVVKS SDYTAIIEEM DANDGSLTYE TRFDLAIKAF 
EHTAAYDSMI ANYFGSKVPA YHGETTQPSG RFPRTLNLNF IKKQDMRYGE NSHQQAAFYI 
EETVAEASVA TAQQLQGKAL SYNNIADTDA ALECVKEFVE PACVIVKHAN PCGVAIGESI 
LDAYERAYKT DPTSAFGGII AFNRELDEAT AQAIISRQFV EVIIAPSASD AALKVTAAKQ 
NVRVLICGQW QQRAPGLDFK RVNGGLLVQD RDLGMVDAAQ LRVVTERQPT EAELRDALFC 
WKVAKFVKSN AIVYARDNMT IGIGAGQMSR VYSAKIAGIK AGDEGLEVKG SVMASDAFFP 
FRDGIDAAAA VGITCVIQPG GSIRDDEVIA AANEHGIAML FTDMRHFRH