Gene Cagg_2677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2677
Symbol	purH
ID	7269584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3280415
End bp	3281932
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	57%
IMG OID	643567503
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002463981
Protein GI	219849548
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000481305
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGGGCAT TAATCAGCGT TTACGATAAG TCTGGGATTG TTGAGTTCGC ACAGGAGTTA 
CATGCACTTG ACGTTGAGAT TATCTCAACC GGTCAAACCC AGCGAGTCTT ACGTGAGGCC 
GGCATCCCGG CAGTAGCAGT AAGCGACATC ACCCATTTTC CTGAAATTCT TGACGGTCGA 
GTCAAAACAC TGCATCCGGC AATCCATGCC GGTCTCCTGG CTCGCCGCGA TGTACCAACC 
CACCTGGCCG AACTTGCTGC TCATGGCCTC AAACCCATCG ATTTGGTCGT TGTGAACCTG 
TACCCCTTTG CCGCCACGAT CGGTCGTCCC GGCGTAACGA TGGCCGAGGC CCAAGAGCAG 
ATTGATATTG GTGGCGTTGC TCTGCTACGC GCCGCCGCCA AGAACTTCCC GGCTGTACTC 
GTGCTGGTTG ACCCGGCTGA CTACGCAGGG GTATTGGCCG GGTTACGCGC CGGCGAGGTG 
CCGTTGGCCG AACGGCAGCG GCTAGCAGCA AAGGCCTTTG CCCATACCGC CGAATACGAT 
GCAGCGATCG CAGCCTATTT GCGTACCGAT CCCTTCCCTG ATGTGTTACC GATGGCATGG 
CGCAAATACC AATCCTTGCG CTACGGCGAA AATCCCCACC AAGCCGCTGC ACTCTACGGC 
AATTTCGGTG CGTTCTTCCA ACAGTTGCAC GGCAAAGAGC TGAGCTATAA CAATATTCTG 
GATACAACCG CGGCTCAAGA ACTTATCGAA GAGTTTCCTC CCGCTGAGGG AGCGGCAGTG 
GCGATTATCA AGCATACGAA TCCCTGCGGT GTAGCCATCG GCCCCGATCT GCGCAGTGCT 
TGGGAAGCAG CCTTCGCCAC CGATCGTGAT GCCCCTTTTG GCGGTATCAT TGCCGTGAAC 
CGTCCGGTCG ATCTTGCCTT TGCTGAAGCG GTAAATGAAA TCTTCTCCGA AATTATTATC 
GCTCCAGAAT TCCAACCTGA TGCGCTCGAA TTACTGCAAC GGAAGAAAAA TCGCCGCTTA 
CTGCGCAATC TGCAACCGGT CACCCGCACC GGTGAATGGC AGATTCGCAG TGTACCCGGC 
GGAGTACTCG TCCAGGAAGC CGATCATGCG CCGCTAGCAG CCGAAGAATG GCGGGTAGTT 
ACCAAACGCG CTCCTACCGA TGCCGAAGTA GCCGCCCTCC GGTTTGGGTG GCGCGTCGTC 
AAACATGTGA AATCCAATGC AATCGTTTAT GCAGCGGCTG ACCGCACCCT CGGCATTGGG 
GCCGGTCAAA TGAGCCGTGT TGATAGCTCA CGACTCGCAG TTTGGAAAGC CCAACAAGCG 
GGGCTTGATC TACGTGGGAG TATCGTGGCA AGTGATGCCC TGTTCCCTTT CGCCGATGGG 
GTCGAAGCAG CCATTGCCGC CGGAGCAACA GCAATCATTC AGCCCGGTGG TTCGGTCCGT 
GATGAAGAGG TTATCGCCGC CGCAGATGCC GCCGGAGCCG CGATGGTCTT CACCGGCCAC 
CGCCATTTCC GCCACTAG

Protein sequence

MRALISVYDK SGIVEFAQEL HALDVEIIST GQTQRVLREA GIPAVAVSDI THFPEILDGR 
VKTLHPAIHA GLLARRDVPT HLAELAAHGL KPIDLVVVNL YPFAATIGRP GVTMAEAQEQ 
IDIGGVALLR AAAKNFPAVL VLVDPADYAG VLAGLRAGEV PLAERQRLAA KAFAHTAEYD 
AAIAAYLRTD PFPDVLPMAW RKYQSLRYGE NPHQAAALYG NFGAFFQQLH GKELSYNNIL 
DTTAAQELIE EFPPAEGAAV AIIKHTNPCG VAIGPDLRSA WEAAFATDRD APFGGIIAVN 
RPVDLAFAEA VNEIFSEIII APEFQPDALE LLQRKKNRRL LRNLQPVTRT GEWQIRSVPG 
GVLVQEADHA PLAAEEWRVV TKRAPTDAEV AALRFGWRVV KHVKSNAIVY AAADRTLGIG 
AGQMSRVDSS RLAVWKAQQA GLDLRGSIVA SDALFPFADG VEAAIAAGAT AIIQPGGSVR 
DEEVIAAADA AGAAMVFTGH RHFRH