Gene Cagg_2184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2184
Symbol
ID	7266757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2677637
End bp	2678662
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	60%
IMG OID	643567015
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_002463503
Protein GI	219849070
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.711574
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATA GTGCCGCCGG AGTTGATATT GCTGCCGCCA CCCGGGCCAA AGAACTGATG 
ACCACCGCCG TGCGCAGCAC CCATGGGCCG GCCGTCTTGG CCGGAATGGG AGCGTTCGGT 
GGTTGTTTTG ATGCCGCACT CGCTCTAGCC GGTATGCAGG CCCCGGTGCT CGTGAGCAGC 
ACCGATGGTG TCGGGACCAA AACTTTAGTC GCCGCTGCTT TAGAACGCTA CGATACGGTT 
GGGCAGGATT TAGTCAACCA TGCCGTAAAC GATATTTTGG TGCAGGGTGC GCGACCGCTC 
TTCTTTCTTG ATTACATTGC CGTCGCCAAA CTCGATCCCA TCCAGATTGC CGCTATCGTC 
AGCGGTGTGG CAGCAGGATG TCGCGCCGTC AGTTGTGCGC TGATCGGGGG CGAAACGGCT 
GAAATGCCCG ATATCTACGC CCCCGGTGCC TTCGATCTGG CCGGCACAAT CGTCGGTGTG 
GTCGAACGGG CCGATCTCTT GCCGCGTCCT GATGTGACCG CCGGCGATGC GATCTTGGCC 
CTCCCTAGCA CCGGTCTACA TACCAATGGC TACTCGCTGG CCCGTCGGAT CGTCGCTCAA 
CACTTCGCCA CCGAAGGCTA CCACGCGCGT CCGTCATTGC TCGGCGGACA AACCATCGGC 
GAGGCGCTAC TGGCTATTCA CCGTTGTTAT CTCGCTGAAG TGAACGCACT GCGCGCAGTT 
GTCCCGGTGA AAGCCCTCTG CCACATCACC GGTGGCGGGA TTTATGACAA TCTCCCCCGC 
GTGCTTCCCA AGGGGATGGG CGCAGAACTC GTGCGCGGCA GTTGGACCAT TCCCCCGATT 
TGTCAGTTGC TGGTAGAAGT CGGTGGCCTC GCCGAGAGTG AGGCTTATCA CACGCTCAAT 
ATGGGGCTGG GCATGCTGGT GATCGTCCCC ACCGAGTCGG TTGCCACCGC CCAAAAGGCC 
GTTGCCGAAG CACAACTGGT CGGTAGAGTA ACGGCCACAC CGACAGTGCG CTTGGTCGAC 
GGATAA

Protein sequence

MKYSAAGVDI AAATRAKELM TTAVRSTHGP AVLAGMGAFG GCFDAALALA GMQAPVLVSS 
TDGVGTKTLV AAALERYDTV GQDLVNHAVN DILVQGARPL FFLDYIAVAK LDPIQIAAIV 
SGVAAGCRAV SCALIGGETA EMPDIYAPGA FDLAGTIVGV VERADLLPRP DVTAGDAILA 
LPSTGLHTNG YSLARRIVAQ HFATEGYHAR PSLLGGQTIG EALLAIHRCY LAEVNALRAV 
VPVKALCHIT GGGIYDNLPR VLPKGMGAEL VRGSWTIPPI CQLLVEVGGL AESEAYHTLN 
MGLGMLVIVP TESVATAQKA VAEAQLVGRV TATPTVRLVD G