Gene Rsph17025_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3066
Symbol
ID	5085074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	3137482
End bp	3138528
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	70%
IMG OID	640484638
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001169255
Protein GI	146279096
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.455526
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.474133
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAAC AGCAGAAGGG TCTGACCTAC GCAGACGCGG GCGTGGACAT CGACGCCGGC 
AACGCGCTCG TCGAGCGGAT CAAGCCCGCC GCACGGCGCA CGGCGCGTCC CGGCACAGTC 
TCGGGCCTGG GTGGGTTCGG CGCGCTCTTC GACCTGAAGG CCGCGGGCTA CCGTGACCCG 
GTGCTGGTGG CGGCCACGGA CGGGGTGGGA ACCAAGCTGC GCATCGCCAT CGACACGGGC 
GAAGTGGATA CGATCGGCAT CGACCTCGTG GCCATGTGCG TGAACGACCT CGTCTGCCAA 
GGGGCAGAGC CGCTTTTCTT CCTCGACTAT TTCGCCACGG GCAAGCTCGA GCTGGATCAG 
GCGGCCCGCA TCATCGAAGG CATTGCCGAA GGATGCGCGG CCTCGGGATG CGCTCTCATC 
GGGGGGGAGA CCGCCGAGAT GCCGGGCATG TACCACAAGG GGGACTTCGA CCTTGCGGGC 
TTCGCCGTGG GCGCAATGGA GCGTGGCGCG GACCTGCCGC GAGGGGTCGC GGCGGGCGAC 
GTGCTGCTCG GGCTCGCATC GAACGGGGTC CATTCCAACG GCTATTCCTT CGTGCGCAAG 
GTCGTCGAAC TCTCGGGGCT CGCCTGGGAT GCGCCGTCGC CGTTCGGCGG GGACAGCCTG 
GGGCGGGCGC TGCTGGCGCC GACGCGGCTC TATGTGACGC AGGCTCTGGC CGCCGTCCGC 
GCGGGCGGCG TCCATGCGCT GGCCCACATC ACGGGCGGCG GGCTCACCGA GAACCTGCCG 
CGGGTGCTGC CCGAGGGGCT GGGCGCGCGC ATCGACCTCG GCGCGTGGGA CCTGCCGCCG 
GTGTTCCGCT GGCTCGCCGA GACCGCCGCG ATGGCCGAGC CGGAGCTTCT CAAGACGTTC 
AACTGCGGCA TCGGCATGAT TGTGGTGGTT GCCGCCGACC GCGCCGACGC GATCGCGGCC 
CTGCTTGAGG CCGAGGGCGA GACCGTCACG CGCATCGGCG AAGTGATCCC CGGCCAGGGT 
GTGAGCTACG ACGGCCGCCT GCTGTGA

Protein sequence

MAEQQKGLTY ADAGVDIDAG NALVERIKPA ARRTARPGTV SGLGGFGALF DLKAAGYRDP 
VLVAATDGVG TKLRIAIDTG EVDTIGIDLV AMCVNDLVCQ GAEPLFFLDY FATGKLELDQ 
AARIIEGIAE GCAASGCALI GGETAEMPGM YHKGDFDLAG FAVGAMERGA DLPRGVAAGD 
VLLGLASNGV HSNGYSFVRK VVELSGLAWD APSPFGGDSL GRALLAPTRL YVTQALAAVR 
AGGVHALAHI TGGGLTENLP RVLPEGLGAR IDLGAWDLPP VFRWLAETAA MAEPELLKTF 
NCGIGMIVVV AADRADAIAA LLEAEGETVT RIGEVIPGQG VSYDGRLL