Gene Cphy_3469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3469
Symbol
ID	5743581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4271626
End bp	4272651
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	39%
IMG OID	641294581
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_001560559
Protein GI	160881591
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTACA AGAAAGCAGG AGTAGACATT GAAGCAGGTT ATAAGGCTGT AGAACTGATG 
AAGAAACATA TTCAGGGAAC GATGAGAAGT GAGGTATTAA CGGGAATTGG TGGTTTCTCG 
GGTGCATTTT CTTTAACCTC CTTTAAAGAC ATGGAGGAAC CTACTTTGGT ATCTGGTACG 
GATGGCGTTG GTACAAAGTT AAAACTTGCC TTTATATTAG ATAAGCATGA TACCATAGGA 
ATTGATTGTG TAGCTATGTG TGTAAATGAT ATTGCTTGTG CGGGCGGTGA ACCGTTATTT 
TTCTTAGACT ATATTGCCTG TGGGAAGAAT GAGCCTGAGA AGATTGCAAC GATTGTTAGC 
GGTGTTGCAG AAGGCTGTAA ACAATCGAAT GCTGCCTTAA TTGGTGGAGA AACTGCTGAA 
ATGCCTGGGT TTTATCCAGT AGAAGAATAT GACCTTGCAG GATTTGCAGT TGGCATCGTT 
GATAGAAAGA AATTAATTAC AGGTGATAAA TTAAAACATG GAGATGTATT AATTGGGATC 
GCTTCTTCTG GGATCCACAG CAATGGATAT TCTTTAGTAC GTAAGGTGTT TCGAATGGAA 
AAGGAGGCAC TTAACACGTA TTATGAAAGT CTTTCCGGTA CACTTGGTGA AGTTCTTTTA 
ACACCAACGA AAATCTATGT GAAAGCTCTT AATAGTTTAA AGACCGGGAA TGTGGAAGTA 
AAAGCTTGCT CTCATATCAC GGGTGGAGGA TTCTATGAGA ATATTCCAAG AATGTTACGA 
GAAGGTGTTA CCGCTATTGT GAAAAAAGAT TCTTATGTCA TTCCTCCGAT TTTTCATATG 
CTACAAAAAG ATGGCAGCAT TGAAGAACAG ATGATGTATA ATACCTACAA TATGGGGATT 
GGTATGATGA TTGCTGTTGA TAAAGCTGAT GCAGACAAAG CAGTGAGCTT ACTGAGTGTA 
GCTGGTGAGA CTGCATATAT TGTTGGTGAG ATTCAGGATG GAGAGAAAGG AATCTGCCTA 
TGCTAA

Protein sequence

MDYKKAGVDI EAGYKAVELM KKHIQGTMRS EVLTGIGGFS GAFSLTSFKD MEEPTLVSGT 
DGVGTKLKLA FILDKHDTIG IDCVAMCVND IACAGGEPLF FLDYIACGKN EPEKIATIVS 
GVAEGCKQSN AALIGGETAE MPGFYPVEEY DLAGFAVGIV DRKKLITGDK LKHGDVLIGI 
ASSGIHSNGY SLVRKVFRME KEALNTYYES LSGTLGEVLL TPTKIYVKAL NSLKTGNVEV 
KACSHITGGG FYENIPRMLR EGVTAIVKKD SYVIPPIFHM LQKDGSIEEQ MMYNTYNMGI 
GMMIAVDKAD ADKAVSLLSV AGETAYIVGE IQDGEKGICL C