Gene Bcer98_0277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_0277
Symbol	purH
ID	5344707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	+
Start bp	318322
End bp	319857
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	39%
IMG OID	640837865
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001373635
Protein GI	152974118
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC GTGCATTAGT AAGTGTTTCT AATAAAACAG GAGTAGTAGA ATTCGTGAAA 
GGTTTGCTTG AACAAGGAAT TGAAGTGATT TCAACAGGTG GCACGAAAAA ATTATTAGAG 
GAAAATGGCT TACAAGTAAT GGGGATTTCT GAAGTAACAG GTTTCCCAGA GATTATGGAT 
GGTCGTGTCA AAACATTACA TCCCAATATT CATGGTGGAT TACTTGCAGT GCGTGATAAT 
GAAGCGCATG TAGCAGAAAT GAGCGAATTA GGCATTCAGC TGATTGATTT TGTCGTTGTA 
AATTTATACC CATTTAAAGA GACGATTGCT AAGCCTGATG TAACATTTGC TGATGCGATT 
GAAAATATTG ATATCGGTGG TCCAACAATG ATTCGTTCAG CTGCAAAAAA TCATAAATTT 
GTATCAGTAA TTGTAGATCC AGCAGACTAT GACGTTGTAT TAGCTGAATT AAAAGAAAAA 
GGTGAGGTTA CAGACGAAAC AAAGCGTAAA TTAGCAGCGA AAGTATTCCG TCATACAGCG 
GCATATGATG CATTAATCTC AAACTATTTG ACTGAACAAA TGGGAGAAGA AAGCCCAGAA 
ATATTAACAG TAACATTCGA GAAAAAGCAA GATTTACGTT ACGGAGAAAA TCCGCATCAA 
AAAGCAACAT TCTATAAAGC ACCATTTGCG GTGGCTTCTT CTGTTGCATA TGCAGAGCAA 
TTGCACGGAA AAGAACTATC TTATAACAAC ATCAATGACG CAGATGCAGC GCTTAGCATT 
GTGAAAGAAT TTACAGAACC AGCGGTAGTC GCCGTAAAAC ATATGAATCC ATGCGGAGTT 
GGTGTTGGTA CGGATATCCA TGAAGCGTAT ACACGTGCTT ATGAGGCGGA TCCAGTATCA 
ATCTTCGGCG GCATTATTGC AGCGAACCGT GAAATTGATA AACGTGTGGC AGAGAAATTA 
CATGAAATCT TCTTAGAAAT TATTATTGCA CCTTCATTTT CGAAAGAGGC TTTAGAAGTA 
TTGCAAAGTA AGAAAAACTT ACGTCTGTTA ACGGTAAATA TTGAGAAGAC AACAAGTGCA 
AGTAAAAAAC TAACTTCTGT TCAAGGTGGA CTTCTTGTTC AAGAAGAAGA TACGTTAGCG 
CTAAATGAAG AGACAATCAT AATTCCTACA AAACGTGAAC CAACAGAGCA AGAATGGAAC 
GACTTAAAAT TAGCTTGGAA AGTTGTAAAA CATGTAAAAT CAAATGCAAT TGTACTCGCA 
AAAGATAATA TGACAATCGG TGTTGGTGCT GGACAAATGA ATCGTGTTGG TTCTGCAAAA 
ATTGCAATCT CGCAAGCAGG TAGCAAAGCG CAAGGTAGCG CCTTAGCATC CGATGCGTTC 
TTCCCAATGC CAGACACAGT AGAAGAGGCC GCAAAAGCGG GGATTACAGC AATCATTCAA 
CCAGGCGGGT CAATCCGTGA CGAAGATTCG ATTAAAAAAG CGGATGAATA TGGGATTACG 
ATGGTGTTCA CGGGCGTACG TCATTTCAAA CATTAA

Protein sequence

MKKRALVSVS NKTGVVEFVK GLLEQGIEVI STGGTKKLLE ENGLQVMGIS EVTGFPEIMD 
GRVKTLHPNI HGGLLAVRDN EAHVAEMSEL GIQLIDFVVV NLYPFKETIA KPDVTFADAI 
ENIDIGGPTM IRSAAKNHKF VSVIVDPADY DVVLAELKEK GEVTDETKRK LAAKVFRHTA 
AYDALISNYL TEQMGEESPE ILTVTFEKKQ DLRYGENPHQ KATFYKAPFA VASSVAYAEQ 
LHGKELSYNN INDADAALSI VKEFTEPAVV AVKHMNPCGV GVGTDIHEAY TRAYEADPVS 
IFGGIIAANR EIDKRVAEKL HEIFLEIIIA PSFSKEALEV LQSKKNLRLL TVNIEKTTSA 
SKKLTSVQGG LLVQEEDTLA LNEETIIIPT KREPTEQEWN DLKLAWKVVK HVKSNAIVLA 
KDNMTIGVGA GQMNRVGSAK IAISQAGSKA QGSALASDAF FPMPDTVEEA AKAGITAIIQ 
PGGSIRDEDS IKKADEYGIT MVFTGVRHFK H