Gene Ccel_2181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2181
Symbol	purH
ID	7310871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2553672
End bp	2555216
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	41%
IMG OID	643609113
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002506503
Protein GI	220929594
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAAGC GTGCATTAAT AAGTGTTTCA GACAAAACAG GTATTGTTGA GTTTGCATCT 
GCTCTGGCTT CCAAGGGTAT AGAGATAATT TCCACAGGAG GAACTGCAAA AGCTCTTTCA 
GCTGCCGGGC TAAAGGTTAT AAACATATCT GACATAACAG GTTTCCCGGA ATGTCTTGAT 
GGAAGGGTAA AAACTCTTCA CCCAAAAGTA CATGCAGGAC TTCTTGCAAT AAGAAGCAAC 
GAGGAACACA TGAAGCAGAT AAAGGAACTG GGTGTTGAAA CAATTGACAT GGTAATAATA 
AACCTTTATC CCTTCAAACA GACAATTTTA AAAGGCAATG TAGAACTGGA AGAAGCTATA 
GAGAACATTG ACATAGGCGG TCCTACGATG CTTAGGGCAG CTGCTAAGAA CTATCAGGAT 
GTTGCAGTTA TTGTTGATCC TGCGGATTAT AAAAATGTAC TGAATGAAAT GAACGAATCT 
GGAGATGTCA GCGTTAAGAC CAAATTCAGA CTGGCCTACA AGGTTTTTGA ACATACAAGT 
CATTATGATA CATTGATTGC AAAATATCTG AGAGACACTC TTGGAGATAT AGATTTCCCT 
GAAACACTTT CACTAACATA TGAAAAGGCT CAGGATATGC GTTACGGCGA AAACCCACAT 
CAAAAAGCAG TATTCTATAA GGAAGTCGGA GCAAACACAG GACTTCTGCC AAGTGCAGTA 
CAACTTCACG GTAAAGAACT TTCCTTCAAT AATATAAATG ATACTAACGG TGCTATAGAG 
CTTGTCAAGG AATTTGACGA GCCGACAGTT GTTGCTGTAA AACATACTAA TCCTTGCGGC 
GTCGGCAGTG CAGACAATAT ATATGACGCT TATATGAGAG CATATGAATC TGATCCTGTA 
TCAATATTCG GCGGAATTAT TGCTGCAAAC AGAGAAATTG ACGCTAAGAC AGCTGAAGAA 
ATCAACAAGA TATTTGTAGA AATAGTTGTT GCACCTTCTT TTACGGAAGA TGCACTTGCC 
GTTTTGACGC AAAAGAAGAA TGTCAGACTT CTTAAACTGG AGAATATCAC TGACGAGATT 
TCACCTGATG CATATGACAT GAAAAAGGTT GCAGGAGGTC TGCTGGTACA GAAGTACAAC 
AGCCAGCTGT TTAATCAGGA AGACCTGAAA TGTGTAACAG ATGTACAGCC TACAAAGGAA 
CAGATGGAAG ACCTTGTTTT TGCAATGAAG GTTGTTAAGC ACACCAAATC AAATGCAATT 
ACTCTTGCAA AGGGCAAGAT GACTATTGGT GTGGGCCCGG GTCAGACAAA CAGAATAGTT 
CCCACGAAGG TATCCATTGA GTATGCAGGA GAGAGATCAC AGGGAGCTGT AATGGCATCA 
GATGCTTACT TTCCGTTCTC AGATTGCGTT GAAGCTGCTG CTGCTGCGGG TATTAAGGCT 
ATTATACAAC CCGGCGGTTC AATAAGAGAT CAGGAATCAA TAGATGCATG CAATAAATAC 
GGAATCGCAA TGGTGTTTAC AGGAATGAGA CACTTTAAGC ACTAA

Protein sequence

MIKRALISVS DKTGIVEFAS ALASKGIEII STGGTAKALS AAGLKVINIS DITGFPECLD 
GRVKTLHPKV HAGLLAIRSN EEHMKQIKEL GVETIDMVII NLYPFKQTIL KGNVELEEAI 
ENIDIGGPTM LRAAAKNYQD VAVIVDPADY KNVLNEMNES GDVSVKTKFR LAYKVFEHTS 
HYDTLIAKYL RDTLGDIDFP ETLSLTYEKA QDMRYGENPH QKAVFYKEVG ANTGLLPSAV 
QLHGKELSFN NINDTNGAIE LVKEFDEPTV VAVKHTNPCG VGSADNIYDA YMRAYESDPV 
SIFGGIIAAN REIDAKTAEE INKIFVEIVV APSFTEDALA VLTQKKNVRL LKLENITDEI 
SPDAYDMKKV AGGLLVQKYN SQLFNQEDLK CVTDVQPTKE QMEDLVFAMK VVKHTKSNAI 
TLAKGKMTIG VGPGQTNRIV PTKVSIEYAG ERSQGAVMAS DAYFPFSDCV EAAAAAGIKA 
IIQPGGSIRD QESIDACNKY GIAMVFTGMR HFKH