Gene CPR_0675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_0675
Symbol	purH
ID	4206513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	796528
End bp	798033
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	31%
IMG OID	642565235
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_698002
Protein GI	110803449
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA GAGCTTTAAT AAGTGTTTTT GATAAAGATG GAGTTTTAGA ACTTGCAAAA 
TTTTTAAGAG ATAGAGATGT AGAAATAATA TCAAGTGGTG GAACTTATAA ATATTTAAAA 
GAAAATAACA TAGAGGTTAA AGAGATAAGT GAAATAACTG ACTTCCCAGA AATGTTAGAT 
GGAAGAGTAA AAACTCTACA TCCTTTAGTT CATGCTGGAA TATTAGCAAT AAGAGATAAT 
AAAGAGCATA TGAAAACTTT AGAAAAGAGA GAAATAAATA CTATAGATTA TGTAGTTGTA 
AATTTATATC CTTTCTTTGA AAAAGTTAGA GAGAATTTAA GCTTTGAAGA AAAGGTTGAG 
TTTATTGATA TAGGTGGACC AACAATGTTA AGAGCGGCAG CTAAGAATTT TAAAGATGTG 
GTAGTTCTTT CAGATAAAAA AGATTATGAA AAAGTAATGA ATGAAATTAA AGAAAATAAT 
TGTGTTTCAT TTAAATTAAG AAAAACTCTT GCAGGAAAAG TATTTAACTT AATGAGTGCT 
TATGATGCTG CAATTTCTAA CTTCTTATTA GAGGGAGAAG AGGAATATCC AGAATATCTA 
TCAGTTTCAT ATAAGAAAAT TCAAGATCTT AGATATGGAG AAAATCCACA TCAAGGAGCT 
GCTTATTATA GTTCAACAGA ATTTGATGGA GCTATGAATA GCTTTGAAAT TTTAAATGGA 
AAAGCCTTAT CTTACAATAA TATAAAGGAT TTAGATATAG CATGGAAGGT TGCTTGTGAA 
TTTGAAGAAA CAGCTTGCTG TGCATTAAAG CATAATACAC CTTGTGGGGT AGCTGTAGGA 
GAAAATTCTA AAGAGGTTTA TTTAAAGGCT TATGATGCTG ATCCAGTTTC AATATTTGGT 
GGAATAGTTG CTATAAATAG AAAGATAGAT AAGGCTACAG CAGAAGAAAT GGTTAAAATT 
TTCTTAGAGG TGGTAGCAGC ACCAGATTTT GATGAAGATG CTTTAGAAGT ATTAAGAACT 
AAAAAGAATT TAAGAGTTAT AAAATGTAAG AATACTCCTC AGGCTAAAAA TTACATGGTA 
ACAGTAGATG GTGGAATATT AGTTCAAGGA GAAGATAATA AACTTGCTAA TGAGTATAAG 
GTTGTAACTA AAAAAGAGCC AACAGAAATG GAATTAAGAG ATATGATCTT TGGAATGAAG 
GTTGTGAAAT ATGTAAAATC TAATGCCATA GTAGTTGTAA AAGATGGAGT TGCCACTGGT 
ATTGGTGGAG GACAAGTTAA TAGAATTTGG GCTACTAAAG AAGCTTTAGA AAGAGGAAAA 
GGTGGAGCAG TATTAGCATC AGATGCTTTC TTCCCATTTA GAGACTGTGT TGACGAAGCG 
GCTAAAAATG GAATAAAAGC AATAATTCAA CCAGGTGGAT CTATTAGAGA TGAGGAGTCT 
GTAGAGGCTT GTAATGAACA TGGAATAAGC ATGGTATTTA CAGGAGTTAG ACATTTTAAA 
CATTAG

Protein sequence

MKKRALISVF DKDGVLELAK FLRDRDVEII SSGGTYKYLK ENNIEVKEIS EITDFPEMLD 
GRVKTLHPLV HAGILAIRDN KEHMKTLEKR EINTIDYVVV NLYPFFEKVR ENLSFEEKVE 
FIDIGGPTML RAAAKNFKDV VVLSDKKDYE KVMNEIKENN CVSFKLRKTL AGKVFNLMSA 
YDAAISNFLL EGEEEYPEYL SVSYKKIQDL RYGENPHQGA AYYSSTEFDG AMNSFEILNG 
KALSYNNIKD LDIAWKVACE FEETACCALK HNTPCGVAVG ENSKEVYLKA YDADPVSIFG 
GIVAINRKID KATAEEMVKI FLEVVAAPDF DEDALEVLRT KKNLRVIKCK NTPQAKNYMV 
TVDGGILVQG EDNKLANEYK VVTKKEPTEM ELRDMIFGMK VVKYVKSNAI VVVKDGVATG 
IGGGQVNRIW ATKEALERGK GGAVLASDAF FPFRDCVDEA AKNGIKAIIQ PGGSIRDEES 
VEACNEHGIS MVFTGVRHFK H