Gene RSP_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1969
Symbol	purM
ID	3719300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	+
Start bp	560737
End bp	561783
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	70%
IMG OID	640070130
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_352018
Protein GI	77462514
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAAC AGCAGAAGGG TCTGACCTAC GCGGACGCAG GGGTGGACAT CGACGCCGGC 
AACGCGCTCG TCGAGCGGAT CAAGCCCGCC GCCAAGCGCA CGGCGCGCCC GGGCACGGTC 
TCGGGTCTCG GCGGGTTCGG CGCGCTCTTC GACCTCAAGG CCGCGGGATA TCAGGACCCG 
GTGCTGGTCG CTGCCACCGA CGGGGTCGGC ACCAAGCTGC GCATCGCCAT CGACACGGGC 
GAAGTGGACA CGATCGGCAT CGACCTCGTG GCCATGTGCG TGAACGATCT CGTCTGCCAG 
GGCGCAGAGC CGCTGTTTTT CCTAGATTAT TTCGCGACGG GCAAGCTCGA GGTCGCGCAG 
GCTGCGCGGA TCATCGAGGG AATCGCGGAA GGCTGCGCCG CCTCGGGCTG CGCGCTGATC 
GGCGGCGAGA CCGCCGAGAT GCCCGGCATG TATCACAAGG GCGACTTCGA TCTCGCGGGC 
TTCGCCGTGG GCGCGATGGA ACGCGGTGCC GACCTGCCGC AGGGCGTCGC AGAGGGCGAC 
TTGCTGCTGG GCCTCGGGTC GAACGGGGTC CATTCGAACG GCTATTCCTT CGTGCGCAAG 
GTGGTCGAGC TCTCGGGGCT CGGCTGGGAT GCGCCCGCGC CCTTCGGCGG CGACAGCCTC 
GGGCGGGCGC TTCTCGCGCC GACGCGCCTC TATGTGAAGC AGGCGCTGGC GGCGGTGCGG 
GCGGGGGGCG TGCATGCGCT GGCCCATATC ACCGGCGGCG GCCTCACCGA GAACCTGCCG 
CGCGTTCTCC CCAAGGGTCT GGGCGCGCGC ATCGACCTTT CCGCCTGGGA GCTGCCGCCG 
GTGTTCCGCT GGCTGGCCGA GACCGCCTCG ATGGCCGAGC CCGAGCTCTT GAAGACCTTC 
AACTGCGGCA TCGGTATGAT CGTCGTGGTC GCGGCCGATC GCGCCGACGA GATTGCGGCC 
CTGCTCGCGG CCGAGGGCGA GACAGTCACG CGGATCGGCG AAGTGATCGC AGGCGAGGGC 
GTGAGCTACG ACGGCCGCCT TCTGTGA

Protein sequence

MAEQQKGLTY ADAGVDIDAG NALVERIKPA AKRTARPGTV SGLGGFGALF DLKAAGYQDP 
VLVAATDGVG TKLRIAIDTG EVDTIGIDLV AMCVNDLVCQ GAEPLFFLDY FATGKLEVAQ 
AARIIEGIAE GCAASGCALI GGETAEMPGM YHKGDFDLAG FAVGAMERGA DLPQGVAEGD 
LLLGLGSNGV HSNGYSFVRK VVELSGLGWD APAPFGGDSL GRALLAPTRL YVKQALAAVR 
AGGVHALAHI TGGGLTENLP RVLPKGLGAR IDLSAWELPP VFRWLAETAS MAEPELLKTF 
NCGIGMIVVV AADRADEIAA LLAAEGETVT RIGEVIAGEG VSYDGRLL