Gene Ppha_2259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ppha_2259
Symbol	purH
ID	6462198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelodictyon phaeoclathratiforme BU-1
Kingdom	Bacteria
Replicon accession	NC_011060
Strand	-
Start bp	2343121
End bp	2344698
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	52%
IMG OID	642728447
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002019071
Protein GI	194337277
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00898643
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGATC CTGTCATCAA GCGGGCGCTG GTCTCTGTAT CTGATAAAAC CGGTATTGTT 
GAATTTTGCC GGGAGTTGAG TGGCATGGGC GTTGAAATTT TCTCAACAGG GGGTACCTTG 
AAGTCGCTTC AGGATTCAGG AGTCAGCGCA TCCTCCATCT CCACCATTAC CGGATTTCCG 
GAAATCATGG ATGGACGGGT CAAAACCCTG CACCCGAAAA TACATGGTGG ACTGCTTGCC 
GTAAGGGAGA ATCCGGAGCA TGTCAAACAG GCTACGGAGA ACGGTATCAG CTTCATTGAT 
CTTGTTGTCG TCAACCTTTA TCCTTTCGAG GCTACAGTGG CAAGGCCGGA TGTAACCTTC 
GAGGATGCTA TAGAGAATAT TGATATTGGT GGTCCATCCA TGCTGCGCAG TGCAGCCAAG 
AACAACGAAT CGGTAACGGT GGTAACCGAT AGTGCCGACT ACGCTCTTGT GCTGCAGGAG 
ATGCGTGAGC ATAACGGTGC GACAAAAAGA ACGACCCGTC TGACGCTTGC CCTGAAAGTA 
TTTGAACTCA CCTCCCGTTA TGACCGTGCC ATTGCCTCTT ACCTTGCCGG AGCAGTCGCA 
GGAGAGCAGC AGGGTGCGGC CTCAAAGATG ACGGTCACTC TTGAGCGTGA GCTCGATATG 
CGTTACGGTG AAAATCCGCA CCAGAGCGCA GGGCTTTACC GCCTGACCGA TGAGAACGGA 
ACACGCTCCT TTGGCGACTT TTTCGAGAAG CTGCATGGCA AGGAGCTCTC CTACAATAAT 
ATGCTCGACA TCGCTGCAGC AGTCTCCCTG ATTGAGGAGT TCCGTGGAGA GGAGCCGACA 
GTGGTCATTG TCAAACACAC CAACCCCTGT GGTGTCGCTC AGGCCCCGAC CCTTGCCGAA 
GCCTACCGCA GGGCATTTTC AACCGATACC CAGGCTCCTT TTGGTGGAAT TATCTCCTTT 
AACCGTCCTC TCGATATGGA GGCAGCAAAG GCGGTCAATG AAATTTTCAC CGAGATTCTC 
ATTGCTCCCG CTTTTGAGGA TGGCGTGCTT GAGATGCTGA TGAAGAAAAA AGATCGCAGG 
CTGGTGCTGC AGACGAACGC TTTGCCCAAA GGTGGCTGGG AGTTCAAGTC AACCCCGTTC 
GGGATGCTTG TTCAGGAACG TGACAGCAAA ATCGTTGCAA AAGAGGATCT GACGGTTGTA 
ACCAAACGGC AGCCGACAGA AGAGGAGATT GCCGACCTGA TGTTTGCCTG GAAAATCTGC 
AAGCATATCA AGTCGAACAC CATTCTCTAT GTCAAGAATC GTCAGACATA CGGCGTCGGC 
GCTGGACAGA TGTCGCGCGT TGACTCCTCC AAAATTGCAC GTTGGAAGGC CTCTGAAGTT 
AGTCTCGACC TGCATGGATC GGTTGTTGCT TCGGATGCGT TTTTCCCCTT CGCTGATGGC 
CTGCTTGCCG CTGCCGAAGC TGGTGTTACC GCAGTCATTC AGCCTGGTGG CTCCATTCGC 
GATAACGAGG TGATTGAAGC AGCCGATGCC AACAACCTTG CGATGGTCTT TACCGGAATG 
CGTCACTTCA AGCATTGA

Protein sequence

MSDPVIKRAL VSVSDKTGIV EFCRELSGMG VEIFSTGGTL KSLQDSGVSA SSISTITGFP 
EIMDGRVKTL HPKIHGGLLA VRENPEHVKQ ATENGISFID LVVVNLYPFE ATVARPDVTF 
EDAIENIDIG GPSMLRSAAK NNESVTVVTD SADYALVLQE MREHNGATKR TTRLTLALKV 
FELTSRYDRA IASYLAGAVA GEQQGAASKM TVTLERELDM RYGENPHQSA GLYRLTDENG 
TRSFGDFFEK LHGKELSYNN MLDIAAAVSL IEEFRGEEPT VVIVKHTNPC GVAQAPTLAE 
AYRRAFSTDT QAPFGGIISF NRPLDMEAAK AVNEIFTEIL IAPAFEDGVL EMLMKKKDRR 
LVLQTNALPK GGWEFKSTPF GMLVQERDSK IVAKEDLTVV TKRQPTEEEI ADLMFAWKIC 
KHIKSNTILY VKNRQTYGVG AGQMSRVDSS KIARWKASEV SLDLHGSVVA SDAFFPFADG 
LLAAAEAGVT AVIQPGGSIR DNEVIEAADA NNLAMVFTGM RHFKH