Gene Cpha266_0657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0657
Symbol	purH
ID	4569811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	748982
End bp	750547
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	50%
IMG OID	639765255
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_911136
Protein GI	119356492
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGATC CTGTCATCAA ACGGGCGCTG GTCTCTGTTT CCGACAAAAC CGGTATTGTG 
GATTTCTGCC GGGAGCTTTC GCTTCTCGGC GTTGAGGTGT TTTCAACGGG CGGAACCCTG 
AAGACTCTTC AGGATGCCGG AATAGCTGCG GCTTCTATTT CGACCATCAC CGGATTTCCG 
GAAATTATGG ATGGGCGGGT CAAAACCCTC CATCCTAAAA TACATGGAGG ACTGCTCGCC 
GTAAGGGAAA ATCCTGATCA TGTCAACCAG GCGAACGAAA ACGGGATCAG CTTTATTGAT 
CTTGTTGTTG TTAACCTTTA TCCATTCGAG GCCACAGTTG CAAAACCGGA CGTGACCTTC 
GAGGATGCCA TAGAAAATAT CGATATCGGC GGTCCCTCCA TGCTTCGCAG TGCTGCCAAG 
AACAACGAAT CGGTAACAGT GGTCACGGAT AGCGCCGACT ATGCGCTTGT GTTGCAGGAG 
ATGCGTAATA ATAACGGTGC GACGAAAAGG GAGACCCGGC TGGCGCTTGC TCTGAAGGTT 
TTTGAACTTA CCTCTCGTTA TGATCGCGCA ATCGCCTCTT ATCTTGCAGG AGCTCAGCAT 
GAAGCAGATT CTTCCATGAC GGTAAAACTT GAACGTGAGC TCGATATGCG CTATGGCGAA 
AATCCTCATC AGAGCGCTGG GCTTTACCGC CTGACTGATG AGAACGGAAC GCGTTCTTTT 
AGCGATTATT TCGAGAAACT GCATGGCAAG GAGCTCTCTT ACAACAATAT GCTCGATATT 
GCCGCCGCAG TCTCCCTTAT TGAGGAGTTC CGTGGTGAAG AGCCGACAGT AGTCATTATC 
AAACATACAA ACCCCTGCGG TGTTGCGCAG GCCCCGACAC TTGCCGAAGC ATACCGGAGA 
GCATTCTCAA CCGATACCCA GGCCCCTTTT GGCGGCATTA TTGCCTTTAA CCATCCTCTC 
GACATGGAAG CGGCAACGGC GGTCAATGAG ATTTTTACCG AGATTCTTAT TGCTCCGGCA 
TTTGAGGATG GCGTGCTTGA GATGCTGATG AAGAAAAAAG ATCGCAGGCT TGTGCGGCAG 
ACGAGTGCCC TGCCCAAAGG TGGTTGGGAG TTCAAGTCTA CTCCGTTCGG GATGCTTGTT 
CAGGAACGTG ACAGCAAAAT CGTCACAAAA GAGGATCTGA CTGTTGTGAC CAAACGGCAG 
CCAACAGAAG AGGAGGTTGC AGACATGATG TTTGCCTGGA AAATCTGCAA GCACATCAAG 
TCAAACACGA TTCTTTATGT TAAAAATCGC CAGACCTTTG GAGTTGGTGC CGGTCAGATG 
TCCCGTGTTG ACTCTTCAAA AATCGCGCGT TGGAAAGCTT CTGAAGTCAA TCTCGATCTG 
CATGGCTCGG TGGTTGCTTC AGATGCGTTT TTCCCGTTTG CCGATGGTCT TCTTGCCGCA 
GCAGAAGCAG GCGTTACCGC AGTTATTCAG CCAGGCGGTT CGATCAGGGA TAACGAGGTG 
ATTGAAGCGG CAGACGCTAA CAATCTTGCC ATGGTTTTTA CAGGAATGCG CCACTTCAAA 
CACTGA

Protein sequence

MSDPVIKRAL VSVSDKTGIV DFCRELSLLG VEVFSTGGTL KTLQDAGIAA ASISTITGFP 
EIMDGRVKTL HPKIHGGLLA VRENPDHVNQ ANENGISFID LVVVNLYPFE ATVAKPDVTF 
EDAIENIDIG GPSMLRSAAK NNESVTVVTD SADYALVLQE MRNNNGATKR ETRLALALKV 
FELTSRYDRA IASYLAGAQH EADSSMTVKL ERELDMRYGE NPHQSAGLYR LTDENGTRSF 
SDYFEKLHGK ELSYNNMLDI AAAVSLIEEF RGEEPTVVII KHTNPCGVAQ APTLAEAYRR 
AFSTDTQAPF GGIIAFNHPL DMEAATAVNE IFTEILIAPA FEDGVLEMLM KKKDRRLVRQ 
TSALPKGGWE FKSTPFGMLV QERDSKIVTK EDLTVVTKRQ PTEEEVADMM FAWKICKHIK 
SNTILYVKNR QTFGVGAGQM SRVDSSKIAR WKASEVNLDL HGSVVASDAF FPFADGLLAA 
AEAGVTAVIQ PGGSIRDNEV IEAADANNLA MVFTGMRHFK H