Gene Tfu_2572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tfu_2572
Symbol	purH
ID	3581499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobifida fusca YX
Kingdom	Bacteria
Replicon accession	NC_007333
Strand	-
Start bp	3030555
End bp	3032123
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	69%
IMG OID	637686288
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_290628
Protein GI	72162971
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACACAGC AGGCCATTCG GCGTGCGTTG ATCAGCGTGT ACGACAAGAC CGGGGTCGAG 
GAGCTAGGAC GCGGCCTCGC TGAAGCAGGG GTGGAGATCG TCTCCACCGG TTCCACTGCT 
GCCCGGCTGA CCGCAGCCGG GGTCGCAGTC ACCCCGGTGG AATCCGTCAC CGGTTTTCCC 
GAGTGTTTCG AAGGCCGGGT GAAGACCCTG CACCCGAAGG TGCACGCGGG ACTGCTCGCT 
GACCGGACCA AGGCCGAGCA CCGGGCGCAG CTCGCCGAAC TCGACATCGC GCCGTTCGAC 
CTGGTCGTGG TCAACCTCTA CCCTTTCGCG GACACGGTTG CGTCCGGCGC TTCCCCTGAG 
GAGTGCATCG AGAAGATCGA CATCGGCGGT CCGGCGATGG TGCGGGCCGC GGCAAAGAAC 
CACGCGAGTG TCGCGGTGGT CGTGGACCCG GCCCGCTACG GCGACGTCCT GAAAGCGGTG 
CGCAGCGGCG GGTTCACCCT GGAGGAGCGC AAGCGGTTGG CGGCGGCGGC TTTCGCGCAC 
ACGGCGAGCT ACGACGCTGC CGTAGCGGCA TGGTTCGCCG AGGCCTACGC CCCCGACGAG 
GTGGCGAAGG ACTCGGGGTG GCCCGAGTTC ACGGCTGTCA CCTACCAGCG GCAGACGACG 
CTGCGCTACG GCGAGAACCC CCACCAGAGC GCAGCACTGT ACCGGCCGGC GAGCGCCAGC 
GGCGAGGGCC TGGCCGGGGC GCGGCAGTTG CACGGCAAGG AGATGTCGTA CAACAACTAC 
GTGGACAGCG ACGCTGCCCT GCGCGCCGCC TACGACTTCA CTGAGCCGTG CGTGGCGATT 
ATCAAACATG CCAACCCGTG CGGGATCGCT GTAGGAGAAA ATATCGCCGA AGCACATCGC 
AAGGCGCACG CCTGCGATCC GGTGTCGGCG TTTGGTGGGG TGATCGCCGC TAACCGCGTT 
GTTGACGAGG CCATGGCCGC GCAGGTCGCC GAGGTGTTCA CCGAGGTTGT CGTGGCGCCC 
GGGTTCAGCC CTGAGGCCGT GGAGATCCTC ACGCGCAAGA AGAACATCCG CCTGCTGGAG 
GTGGCGGAGC CGGACCGCGG GGCCCGGCGG GAGATGCGGC AGATCAGCGG CGGGCTGCTG 
ATGCAGGACG CCGACCTGGT CGACGCGCCC GGGGATGATC CTGCGCAGTG GCAGTTGCGG 
GCCGGACCAG CCGCGGATGA GGCGACCCTG GCCGATCTGG CCTTCGCGTG GCGTGCGGTG 
CGGGCCGTGA AATCCAACGC GATCCTGCTG GCTGCCGACC GGGCCACGGT GGGCGTGGGC 
ATGGGCCAGG TGAACCGGGT GGACTCGGCT CGCCTCGCGG TGACACGCGC CGGGGAGCGG 
GTGAAGGGCT CCGTAGCCGC GAGTGACGCG TTCTTCCCCT TCCCTGACGG ACTGGAAGTG 
CTGGCCGAGG CAGGCGTGCG GGCGATCGTG CAGCCGGGAG GTTCGGTGCG GGACGACGAA 
GTCATCGCCG CTGCCGAGCG TGCCGGGGTG ACCTTGTACT TCACCGGAAC CCGGCACTTC 
TTCCACTGA

Protein sequence

MTQQAIRRAL ISVYDKTGVE ELGRGLAEAG VEIVSTGSTA ARLTAAGVAV TPVESVTGFP 
ECFEGRVKTL HPKVHAGLLA DRTKAEHRAQ LAELDIAPFD LVVVNLYPFA DTVASGASPE 
ECIEKIDIGG PAMVRAAAKN HASVAVVVDP ARYGDVLKAV RSGGFTLEER KRLAAAAFAH 
TASYDAAVAA WFAEAYAPDE VAKDSGWPEF TAVTYQRQTT LRYGENPHQS AALYRPASAS 
GEGLAGARQL HGKEMSYNNY VDSDAALRAA YDFTEPCVAI IKHANPCGIA VGENIAEAHR 
KAHACDPVSA FGGVIAANRV VDEAMAAQVA EVFTEVVVAP GFSPEAVEIL TRKKNIRLLE 
VAEPDRGARR EMRQISGGLL MQDADLVDAP GDDPAQWQLR AGPAADEATL ADLAFAWRAV 
RAVKSNAILL AADRATVGVG MGQVNRVDSA RLAVTRAGER VKGSVAASDA FFPFPDGLEV 
LAEAGVRAIV QPGGSVRDDE VIAAAERAGV TLYFTGTRHF FH