Gene BCG9842_B4985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B4985
Symbol	purK
ID	7185287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	+
Start bp	295772
End bp	296923
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	38%
IMG OID	643548095
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_002443807
Protein GI	218895396
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	168
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAA TCATTTTACC TGGAAAAACA ATCGGCATTA TTGGAGGCGG CCAGCTAGGA 
AGAATGATGG CATTGGCAGC CAAGGAGATG GGATATAAAA TTGCTGTTTT AGATCCTACA 
AAGCATTCAC CATGTGCACA AGTTGCTGAT ATTGAAATCG TTGCACCGTA TGACGATTTA 
AAGGCAATTC AGCATTTAGC AGAGATAAGT GATGTTGTCA CATATGAATT TGAGAATATT 
GATTATAGAT GTTTACAATG GCTTGAAAAA CATGCTTACT TGCCACAAGG TAGTCAGTTG 
TTAAATAAAA CGCAAAATCG TTTTACAGAA AAGAATGGAA TTGAGAAGGC TGGGTTACCG 
GTAGCAACGT ATAGATTAGT TCAAAATCAA GATCAGCTTA CAGAAGCAAT TGCTGAGTTA 
TCATTCCCTT CCGTCTTAAA AACGACGACA GGTGGATATG ATGGGAAAGG GCAAGTTGTT 
TTAAGAAGTG AGGCTGATGT TGAGACAGCA AGAAATCTTG TGGATAAAGC AGAGTGTATT 
TTAGAGAAAT GGGTGCCTTT TGAAAAAGAA GTATCTGTTA TTGTGATTCG TAGTGTAAGT 
GGTGAAACGA AAGTGTTTCC AGTAGCGGAA AATATTCATG TAAATAACAT TTTGCATGAA 
TCTATCGTTC CAGCTCGTAT TACAGAAGAG CTTTCTCAAA AAGCAATTGC TTATGCAAAG 
GTACTTGCGG ATGAATTAAA ACTTGTGGGA ACACTAGCTG TAGAGATGTT TGCTACAGCT 
AATGGTGAGA TTTACATTAA TGAATTAGCA CCAAGACCTC ACAATTCAGG ACACTACACA 
CAGGATGCAT GTGAAACGAG CCAATTTGGT CAACATATTC GAGCAATCTG TAATTTACCT 
CTAGGAGAAA CAAATTTGTT AAAACCAGTT GTCATGGTAA ACATTTTAGG CGAACATATA 
GAAGGGGTCC TAAGACAAGT GAATAGACTA ACCGGGTGCT ATTTACACTT GTATGGAAAA 
GAAGAAGCAA AAGCACAGCG AAAAATGGGG CATGTTAATA TTTTAAATGA TAATATTGAA 
GTTGCTCTAG AAAAAGCGAA GAGTTTGCAT ATTTGGGACC ATCAAGAACA ACTGTTGGAG 
GGAAAAAGAT GA

Protein sequence

MTRIILPGKT IGIIGGGQLG RMMALAAKEM GYKIAVLDPT KHSPCAQVAD IEIVAPYDDL 
KAIQHLAEIS DVVTYEFENI DYRCLQWLEK HAYLPQGSQL LNKTQNRFTE KNGIEKAGLP 
VATYRLVQNQ DQLTEAIAEL SFPSVLKTTT GGYDGKGQVV LRSEADVETA RNLVDKAECI 
LEKWVPFEKE VSVIVIRSVS GETKVFPVAE NIHVNNILHE SIVPARITEE LSQKAIAYAK 
VLADELKLVG TLAVEMFATA NGEIYINELA PRPHNSGHYT QDACETSQFG QHIRAICNLP 
LGETNLLKPV VMVNILGEHI EGVLRQVNRL TGCYLHLYGK EEAKAQRKMG HVNILNDNIE 
VALEKAKSLH IWDHQEQLLE GKR