Gene Anae109_1399 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1399
Symbol	purH
ID	5374120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1580889
End bp	1582463
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	72%
IMG OID	640842909
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001378590
Protein GI	153004265
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.136347
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCGCC GCGCTCTCGT CTCCGTCTCC GACAAGACGG GCCTCGTCCC GTTCGCGAAG 
CGGCTCGCCG CGCTCGGCGT CGAGATTCTC TCCACCGGCG GCACGCAGCG CGCGCTCGCC 
GACGCCGGCG TGCCCGTCGT CTCGGTGGGT GACTACACGC AGGCTCCGGA GATCCTGGCC 
GGGCGCGTGA AGACCCTCCA CCCGCGCGTG CACGGCGGCA TCCTCTACCG GCGCGGCCTC 
GCGTCCGACG AGGCCGACGT GAAGGCCCGG GACATCCCCC CCATCGACCT CGTGGTGGTG 
AACCTCTACC CGTTCCGCGA GGCGGTCGCG GCCGGGAAGC CGTTCTGGGA CTGCGTCGAG 
GAGATCGACA TCGGCGGGCC GACCATGGTG CGCAGCGCGG CGAAGAACGC GGCGCACGTG 
GGCGTGGTGG TCGACCCCGC GGACTACGAG CGCGTCGCGG CCGAGCTCGA GGCCTCGCGC 
GCGCTGTCGG ATCAGACGCG CTTCGAGCTC ATGAAGAAGG CCTTCGCCCA CACGGCCGCC 
TACGACGCCG CCATCTCCGA GTTCCTCACG GCGCGCGAGA GCACGGACGC GCAGGCGAAG 
CGCTTCCCCG CCACGCTCGC CGCCGTCTAC TCGAAGGCGG GGGACCTCCG CTACGGCGAG 
AACCCCCACC AGGCGGGCGC CTTCTACCGC GCCGGCCGCG AGCCGGACGA GCCGACGGTC 
GCCTTCGCGA AGGTGCTGCA GGGCAAGGAG CTCAGCTACA ACAACCTCCT CGACCTCGAG 
GCGGCCCTCG CCGCCGTCAA GGAGCACGAC GAGGTCGCCT GCGTCGTCAT CAAGCACAAC 
ACCCCCTGCG GCGTGTCGCT CGGGAAGACG CCCGCGGAGG CGTTCGCGCG CGCCCGCGCG 
TGCGACCCGG TCTCCGCGTT CGGCGGCATC GTCGCGCTCA ACCGCCCCGT CGACGCCGCG 
GCCGCGAAGG AGCTGACCGA TCTCTTCCTC GAGTGCGTGA TCGCGCCCGG CTACGACGAG 
GCCGCGCGCG CCGCCCTCGG CGCGAAGAAG AACCTGCGGC TGCTCGAGGC GCCGCGGCTC 
GCCGAGCCGC GCACGAGCTG GACGCGCCGG CCCGAGGAGC TCCGCGAGCT CCGCTCGATC 
CCCGGCGGCC TGCTCGTCAT GGACCGCGAT CTCGGCGCCA TCCGCCGCGA CGACTGCAAG 
GTGATGACGA AGCGCGCGCC GACCGACGCC GAGTGGGAGG ATCTCCTCTT CGCGTGGAAG 
GTCGTGAAGC ACGTGAAGTC GAACGCGATC GTCTTCGCGA AGGAGAAGCG CACGGTCGGC 
ATCGGGGGCG GGCAGACGAG CCGGGTCGAG TCGGTGAAGA CGGCCGTCAT GAAGGCCCAG 
CTCGAGCTCG TCGGGTCGAC GGTCGGCTCG GACGCCTTCT TCCCGTTCAA GGACGGCGTC 
GAGGAGATCA TCAAGGCCGG CGCGACCGCC ATCATCCAGC CCGGCGGCTC GGTGCGCGAC 
CCCGAGGTGA TCGAGGCCGC GGACGCGGCG AACGTGGCGA TGGTGGCCAC CGGGATGCGC 
CACTTCCGGC ACTGA

Protein sequence

MVRRALVSVS DKTGLVPFAK RLAALGVEIL STGGTQRALA DAGVPVVSVG DYTQAPEILA 
GRVKTLHPRV HGGILYRRGL ASDEADVKAR DIPPIDLVVV NLYPFREAVA AGKPFWDCVE 
EIDIGGPTMV RSAAKNAAHV GVVVDPADYE RVAAELEASR ALSDQTRFEL MKKAFAHTAA 
YDAAISEFLT ARESTDAQAK RFPATLAAVY SKAGDLRYGE NPHQAGAFYR AGREPDEPTV 
AFAKVLQGKE LSYNNLLDLE AALAAVKEHD EVACVVIKHN TPCGVSLGKT PAEAFARARA 
CDPVSAFGGI VALNRPVDAA AAKELTDLFL ECVIAPGYDE AARAALGAKK NLRLLEAPRL 
AEPRTSWTRR PEELRELRSI PGGLLVMDRD LGAIRRDDCK VMTKRAPTDA EWEDLLFAWK 
VVKHVKSNAI VFAKEKRTVG IGGGQTSRVE SVKTAVMKAQ LELVGSTVGS DAFFPFKDGV 
EEIIKAGATA IIQPGGSVRD PEVIEAADAA NVAMVATGMR HFRH