Gene RPB_2489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2489
Symbol
ID	3910278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2847061
End bp	2848134
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	67%
IMG OID	637884388
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_486105
Protein GI	86749609
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.240095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC GGAAGCACGG CCTCACCTAT GCCGATTCCG GCGTCGATAT CGACGCCGGC 
AATCGCCTCG TCGACCTGAT CAAGCCGATG GTCCGGGCCA CCGCCCGGGC CGGCGCGGAC 
TCCGAAATCG GCGGCTTCGG CGGACTGTTC GACTTGAAGG CCGCGGGCTT CAAGGACCCG 
GTGCTGGTGG CGGCGACCGA CGGCGTCGGA ACCAAGATCA AGGTCGCGAT CGAGGCCGGG 
GTGCACGCCG GGATCGGTAT CGACCTGGTC GCGATGTCGG TCAATGATCT GGTCGTCCAG 
GGCGCCGAGC CGCTGTTCTT TCTCGACTAT TTCGCGTGCG GCAAACTCGA TCCCGAGGCC 
GTGGCCGAAA TCGTCGCAGG CGTCGCCGAA GGCTGCCGCG AGTCTGGCTG TGCGCTGATC 
GGCGGCGAGA CCGCGGAAAT GCCGGGCCTC TACAAGGACG GCGACTATGA TCTCGCCGGC 
TTCGCGGTCG GCGCGGCGGA ACGCGGCACG CTGCTGCCCT CCCCCGACAT CACCGCCGGC 
GACGCGGTGA TCGGGCTGGC CTCATCCGGG GTGCATTCGA ACGGGTTTTC GCTGGTCCGC 
AAGATCGTCG AAAAATCCGG CCTGCCCTAC GACGCCAAGG CGCCGTTCTC GCCGGTGATG 
ACGCTCGGCG GAGCGCTGCT GACGCCGACC CGGCTCTACG TGAAATCCTG TCTGCAGGCG 
ATCCGCACCA CCGGCGCGAT CAAGGGGCTG GCGCATATCA CCGGTGGCGG TTTCACCGAC 
AACATCCCGC GGGTGCTGCC GAAGCATCTC GGCGTCGGCA TCGACCTGCC GCGGCTGCCG 
GTGCTGCCGG TGTTCAAATG GCTGGCCGAA CAAGGCGACA TCGCCGAACT CGAACTGCTG 
CGCACCTTCA ATTGCGGCAT CGGCATGATC GCGATCGTCA AGGCGGACGC CGTCGACGCC 
GTCACCGAGG CGCTGACCGC GGGCGGCGAG AGCGTGCATC TGCTCGGCGA AGTGATCGCG 
GCGAAGGGCG AACATCGCGT CGTCTACGAC GGTCACCTCG ACCTGTCCTG GTGA

Protein sequence

MTERKHGLTY ADSGVDIDAG NRLVDLIKPM VRATARAGAD SEIGGFGGLF DLKAAGFKDP 
VLVAATDGVG TKIKVAIEAG VHAGIGIDLV AMSVNDLVVQ GAEPLFFLDY FACGKLDPEA 
VAEIVAGVAE GCRESGCALI GGETAEMPGL YKDGDYDLAG FAVGAAERGT LLPSPDITAG 
DAVIGLASSG VHSNGFSLVR KIVEKSGLPY DAKAPFSPVM TLGGALLTPT RLYVKSCLQA 
IRTTGAIKGL AHITGGGFTD NIPRVLPKHL GVGIDLPRLP VLPVFKWLAE QGDIAELELL 
RTFNCGIGMI AIVKADAVDA VTEALTAGGE SVHLLGEVIA AKGEHRVVYD GHLDLSW