Gene RPD_2955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2955
Symbol
ID	4023458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3293822
End bp	3294895
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	65%
IMG OID	637963155
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_570083
Protein GI	91977424
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC GGAAGCACGG CCTCACCTAT GCTGATTCCG GCGTCGACAT CGACGCGGGC 
AATCGTCTTG TCGACCTGAT CAAGCCGATG GTGCGGGCCA CCGCTCGCCC CGGCGCCGAT 
TCCGAAATCG GCGGCTTCGG CGGGCTGTTC GATCTGAAAG CCGCAGGCTT CAAGGACCCG 
GTTCTGGTGG CGGCCACCGA CGGCGTCGGC ACCAAGATCA AGGTTGCGAT CGAGGCCGGA 
TTGCACGCCG GCATCGGGAT CGATCTGGTC GCAATGTCGG TGAACGACCT CGTGGTGCAG 
GGCGCCGAGC CGCTGTTCTT TCTCGACTAC TTCGCCTGCG GAAAACTCGA TCCGGAAGCC 
ACGGCCGAAA TCGTCGCCGG GGTGGCCGAA GGCTGCCGCG AGTCCGGCTG CGCGCTGATC 
GGCGGCGAGA CCGCCGAGAT GCCGGGGCTC TACAAGGACG GCGACTACGA TCTCGCCGGC 
TTCGCGGTGG GCGCGGCCGA GCGTGGAACC CTGTTGCCCT CCCCGGACAT TGCCAAAGGC 
GATGCAGTGA TCGGGCTCGC CTCTTCGGGC GTGCATTCGA ACGGCTTTTC GCTGGTGCGC 
AAGATCGTCG AGAAATCCGG CCTGCCCTAT GACGCGCAGG CGCCGTTCTC GCCGGTGATG 
ACGCTCGGTG GCGCATTGCT GACGCCGACC AAACTTTACG TGAAATCGTG CCTGAACGCG 
ATCCGCACGA CCGGCGCGAT CAAAGGACTG GCGCATATCA CGGGCGGCGG ATTCACCGAC 
AACATCCCGC GCGTACTCCC GAAACATCTC GGCGTCGGAA TCGATCTGCC GCGACTTCCA 
GTGTTGCCGG TGTTCAAATG GCTCGCCGAG CAAGGCGGCA TCGCCGAACT CGAATTGCTG 
CGCACCTTCA ACTGCGGCAT CGGAATGATC GCGATCGTCA GAGCCGACGC CGTCGACGCC 
GTCACCGAGG CGCTCACCAG CAGCGGGGAA AGCGTCCATC TGCTCGGTGA AGTGATCGAG 
GCCACGGGCG AGCATCGCGT CGTTTACGAC GGTCACCTCG ATCTCGGTCG GTGA

Protein sequence

MTERKHGLTY ADSGVDIDAG NRLVDLIKPM VRATARPGAD SEIGGFGGLF DLKAAGFKDP 
VLVAATDGVG TKIKVAIEAG LHAGIGIDLV AMSVNDLVVQ GAEPLFFLDY FACGKLDPEA 
TAEIVAGVAE GCRESGCALI GGETAEMPGL YKDGDYDLAG FAVGAAERGT LLPSPDIAKG 
DAVIGLASSG VHSNGFSLVR KIVEKSGLPY DAQAPFSPVM TLGGALLTPT KLYVKSCLNA 
IRTTGAIKGL AHITGGGFTD NIPRVLPKHL GVGIDLPRLP VLPVFKWLAE QGGIAELELL 
RTFNCGIGMI AIVRADAVDA VTEALTSSGE SVHLLGEVIE ATGEHRVVYD GHLDLGR