Gene Dole_0293 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0293
Symbol
ID	5693112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	336565
End bp	337605
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	57%
IMG OID	641262874
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_001528180
Protein GI	158520310
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCTC TGACCTACGC GGATGCCGGC GTGGATATTG ATAAAGCCAA CGCGCTTGTG 
GACAACATCA AGAAAATCGC CAAGCAGACC CGGCGGCAGG GGGTGATGGG CGACATCGGC 
GGGTTCGGCG GGCTTTTCTC CCTGAACCTG TCGGACCTGA AAAATCCTGT GCTGGTCAGC 
TCCACCGACG GTGTGGGCAC CAAGCTGAAG ATCGCCTTTA TGGCGGGCCG GCACGATACC 
GTGGGCATCG ACCTTGTGGC CATGTGCGTC AACGATATTG CCGTCCAGGG CGCAAAACCG 
CTCTTTTTTC TGGACTACAT GGCCGTGGGA AAGCTGAATA CAGAGATCGC CACCCAGGTG 
ATCACCGGCA TCGGAGAGGG ATGCAAACAG GCCAAATGCG CCCTGATCGG CGGTGAAACC 
GCTGAAATGC CGGGTTTTTA CAAAGACAAC GAGTATGACC TGGCCGGTTT TACCGTGGGC 
ATCGTGGAGA GCGACGCCAT TATTGACGGG TCCAACATTC ACGTGGGCGA CGCCATTATC 
GGCATCGCTT CCAGCGGGCT GCACAGCAAC GGTTTTTCTC TGGTCCGCAA GATATGCTTT 
GACGTGCTGA AGCTCAAGAT TGACGATCAT ATCGACGATC TGGGCAAAAC CCTGGCCGAG 
GAGCTGTTGA CCCCCACTAT CATTTATTCG GAGACGGTTC ACAGCCTGCT CAAGCTCTTT 
CCGATTCACG GCATCGCCCA TATCACCGGC GGCGGTCTGG CCGAAAACGT GGTCCGGGTG 
CTGCCCCAGG CCTGCGTGGC CACCATTCGA AAAGGATCAT GGGACGTGCC TCCGGTCTTT 
TCTTTTTTGC AAAAGGCAGG AAAGGTCGAA GACCGCGAGA TGACCCGCAC CTTTAACAAC 
GGCATCGGCC TGGTGGTGGT GGTGCCCGCG AAAAAAGCCG ACGATGCCAT GGCAAGCATT 
CGGGCCGTGG GGGAAAAGCC GTTTCTGATC GGTGAGATCA CCCCCAGAAA AGCGGATGAA 
CCCCAGGTGC AACTGGTGTA A

Protein sequence

MSSLTYADAG VDIDKANALV DNIKKIAKQT RRQGVMGDIG GFGGLFSLNL SDLKNPVLVS 
STDGVGTKLK IAFMAGRHDT VGIDLVAMCV NDIAVQGAKP LFFLDYMAVG KLNTEIATQV 
ITGIGEGCKQ AKCALIGGET AEMPGFYKDN EYDLAGFTVG IVESDAIIDG SNIHVGDAII 
GIASSGLHSN GFSLVRKICF DVLKLKIDDH IDDLGKTLAE ELLTPTIIYS ETVHSLLKLF 
PIHGIAHITG GGLAENVVRV LPQACVATIR KGSWDVPPVF SFLQKAGKVE DREMTRTFNN 
GIGLVVVVPA KKADDAMASI RAVGEKPFLI GEITPRKADE PQVQLV