Gene GYMC61_1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_1139
Symbol	purH
ID	8524978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	+
Start bp	1150614
End bp	1152152
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	55%
IMG OID
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_003252277
Protein GI	261418595
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTGA AACGAGCATT GATCAGCGTG TCCAATAAGG AAGGCATCAT TCCGTTTGCG 
AAGCAGCTGG CTGAACTTGG CATTGATATC ATTTCGACCG GTGGGACAAA ACGAGCGCTT 
GAAGACGCCG GCGTTCCCGT CATTTCGATT TCCGATGTCA CCGGCTTTCC GGAAATTTTG 
GACGGGCGCG TCAAAACATT GCATCCGGCC ATTCACGGCG GCATTTTGGC GGTGCGCAGC 
GATGAGCGCC ACCAAGCAGC GCTTAAAGAG CACGGCATTC GCCCGATCGA TTTGGTCGTC 
GTCAACTTGT ATCCGTTCCA ACAAACGATC GCCAAACCGG ATGTGACGCT CGCCGAGGCG 
ATTGAAAACA TCGATATCGG CGGCCCGACG ATGGTGCGGG CGGCGGCGAA AAACTATGCT 
GATGTCGCGA TTGTCGTCGA TCCAGCCGAC TATCCGATAG TGATTGAAGA ACTGAAAATG 
ACCGGTTCGA TCCAAGCAAA AACGCGGCAA CAACTGGCGG CGAAAGCGTT CCGCCATACG 
GCGGCGTATG ACGCGATGAT TGCGGAGTAT TTGACAAACC TCACCGGAGA GAACTATCCG 
GAAACGCTCA CGGTCACGTA TACGAAAAAA CAATCATTGC GCTATGGCGA GAATCCGCAT 
CAATCGGCAG CGTTTTATGC CAAGCCGCTC GGTGCGGCGT TCTCGATTGC CAACGCGACA 
CAGCTGCATG GCAAAGAGTT GTCGTACAAC AACATTAACG ACGCCAATGC GGCGATCAAC 
CTCATTCGCG AATTTCAAGA GCCGGCTGTG GCCGCCATCA AACATATGAA CCCATGCGGC 
GTCGGCGTCG GCGCGACGCT TCTTGAGGCG TTTACGAAAG CGTATGAAGC GGATCCAGTC 
TCGATTTTCG GCGGCATTAT TGCGGTCAAC CGTGAAGTGG ACAAAGAAAC AGCCGAACGG 
ATGCACGACA TCTTTTTGGA AATCGTCATC GCTCCGTCAT TCAGCGACGA GGCGCTTGCC 
ATTTTGACGA AAAAGAAAAA CATCCGTCTG TTGACGCTTG ATTTTACCGG GCCGGACGTC 
AAGGAAAACA TGCTCGTTTC CGTCAATGGC GGCTTGCTCG TCCAAGAGGC CGATACGTTC 
ACGCTTGAAG ACGCCGAATG GAATGTCGTA ACGAAGCGCG AGCCGACCGA GGCTGAGCGC 
GAACAGCTTC GGTTTGCTTG GAAGGTTGTC AAACATGTGA AATCGAATGC GATTGTACTG 
GCCAAAAACG GGATGACGGT CGGCGTTGGC ACCGGGCAAA TGAACCGGGT CGGCGCGGCC 
AAAATTGCGA TTGAACAGGC TGGGGAACAG GCGGTTGGCG CCGTGTTGGC GTCCGATGCG 
TTCTTCCCGA TGGACGATAC GGTCGAGGCG GCGGCGAAAG CCGGCATTAC CGCGATCATT 
CAGCCGGGCG GCTCGATTCG CGACGCCGAC TCGATCCGCA AAGCGGATGA ATACGGCATC 
GCCATGGTCT TCACCGGCGT GCGCCACTTT AAACATTAA

Protein sequence

MAVKRALISV SNKEGIIPFA KQLAELGIDI ISTGGTKRAL EDAGVPVISI SDVTGFPEIL 
DGRVKTLHPA IHGGILAVRS DERHQAALKE HGIRPIDLVV VNLYPFQQTI AKPDVTLAEA 
IENIDIGGPT MVRAAAKNYA DVAIVVDPAD YPIVIEELKM TGSIQAKTRQ QLAAKAFRHT 
AAYDAMIAEY LTNLTGENYP ETLTVTYTKK QSLRYGENPH QSAAFYAKPL GAAFSIANAT 
QLHGKELSYN NINDANAAIN LIREFQEPAV AAIKHMNPCG VGVGATLLEA FTKAYEADPV 
SIFGGIIAVN REVDKETAER MHDIFLEIVI APSFSDEALA ILTKKKNIRL LTLDFTGPDV 
KENMLVSVNG GLLVQEADTF TLEDAEWNVV TKREPTEAER EQLRFAWKVV KHVKSNAIVL 
AKNGMTVGVG TGQMNRVGAA KIAIEQAGEQ AVGAVLASDA FFPMDDTVEA AAKAGITAII 
QPGGSIRDAD SIRKADEYGI AMVFTGVRHF KH