Gene Daud_1629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1629
Symbol	purH
ID	6026187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	1717671
End bp	1719212
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	65%
IMG OID	641594452
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_001717763
Protein GI	169831781
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATGC AGCGGGCACT GATCAGTGTT TCCGACAAGC GGGGGTTGCT GGAGCTGGCT 
CAGGGCCTGA CCGAACTGGG GATGGAGATC GTGTCCACCG GGGGCACGGC CCGGGTACTC 
CGGGAGATGG GCTTCGGGGT GCTTGGAGTG TCCGAGGTCA CCGAGTTTCC CGAGATCCTC 
GGAGGCCGGG TAAAGACGCT GCACCCCCGC ATCCACGGGG GAATTCTAGC CCGGCGCACG 
CCCGAGCACA TGGGGCAACT GGCCGAGTTT GGGATCCGCC CGGTGGACCT GGTGGTGGTC 
AACCTCTATC CGTTTAAGGA GACCATCGCC CGGCAGGGCG TCACCCTGGA GGAGGCCGTT 
GAACAGATCG ACGTCGGCGG GCCGGCGATG CTTCGGGCAG CGGCCAAGAA CCACCGTCAC 
GTGCTGGTGG TCGTGAACCC GGACCGGTAC CCGGAAGTGC TGGCCGCCCT CAAGGCGGGA 
ACGGTCGACG ACCGGATGCG CCTGACCTTG GCCCGGGAGG CCTTTGCGCA CACCGCCCAC 
TACGACGCCG TGATCGCCGC TTACCTGGGC GAGTTCGTGG AGGAACAGGA CCTCTTCCCG 
GGGGAAATCG CGCTGCCGTT TGAGAGAAAG CAGCTCTTGC GCTACGGCGA GAACCCCCAC 
CAGAAGGCGG CCTTTTACCA GGACCCGCGC CGGCGGGGAG CTTCGGTGAC TTCCGCCGTG 
CAGCGGCAGG GCAAGGAGCT TTCGTACAAC AACATCCTCG ACCTGAATGC CGCCCTGGAA 
CTGGTCCGGG AATTCAGTAC GCCGGCGGCG GTGATCGTCA AGCACAACAA CCCGTGTGGA 
ACGGCCTGCC GCCCGTCTCC GGCCGAGGCG TACCGCCGGG CCTTTGCGGC CGACGAGGTT 
TCCGCCTTCG GCGGAATTGT CGCTTTTAAC TGCCCGGTGG ACGAAGAGGC GGCGCATGAG 
ATGGTCAAGA TTTTCCTGGA GGCGGTCATC GCCCCGCAGT TCACGCCCGA GGCGCTGGCG 
GTATTGAGTG ACAAGAAGAA TCTGCGGGTG CTCGAAACTG GAGACCTGAC CCCGCTCACC 
CTGGACTGGA TGGACGTCCG GAAAGTGAAC GGGGGCCTTC TGGTGCAGCA GGCTGACCGC 
CAGCTCTTTC CCTACACCAA CTTCCGGGTG GTGACCCGGC GCGCACCCAC ACCTGAAGAA 
CTTGTCGAGA TGGATTTCGC TTTCAAGATC GTCAAGCACG TCAAGTCCAA CGCCATCGTG 
GTGACCCGTG AGCAGACGCT CATCGGCGTG GGGGCCGGGC AGATGAACCG GGTCGGAGCG 
GCGCGGATCG CCCTGGAACA GGCCGGGGAC AAGGCTCTGG GCGCCGTGCT GGCATCCGAC 
GCCTTTTTCC CGTTTGCGGA CACCGTGGTC GCGGCGGCCG AGGCGGGCAT TACAGCCATC 
GTCCAGCCAG GAGGCTCGAT GCGGGACCAG GAGTCGATCG AAGCTGCGGA CGCCCGGGGG 
ATCGCGATGG TGTTCACCGG CGTCCGCCAC TTCAAGCACT AA

Protein sequence

MAMQRALISV SDKRGLLELA QGLTELGMEI VSTGGTARVL REMGFGVLGV SEVTEFPEIL 
GGRVKTLHPR IHGGILARRT PEHMGQLAEF GIRPVDLVVV NLYPFKETIA RQGVTLEEAV 
EQIDVGGPAM LRAAAKNHRH VLVVVNPDRY PEVLAALKAG TVDDRMRLTL AREAFAHTAH 
YDAVIAAYLG EFVEEQDLFP GEIALPFERK QLLRYGENPH QKAAFYQDPR RRGASVTSAV 
QRQGKELSYN NILDLNAALE LVREFSTPAA VIVKHNNPCG TACRPSPAEA YRRAFAADEV 
SAFGGIVAFN CPVDEEAAHE MVKIFLEAVI APQFTPEALA VLSDKKNLRV LETGDLTPLT 
LDWMDVRKVN GGLLVQQADR QLFPYTNFRV VTRRAPTPEE LVEMDFAFKI VKHVKSNAIV 
VTREQTLIGV GAGQMNRVGA ARIALEQAGD KALGAVLASD AFFPFADTVV AAAEAGITAI 
VQPGGSMRDQ ESIEAADARG IAMVFTGVRH FKH