Gene Rpal_3461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3461
Symbol
ID	6411135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	3706320
End bp	3707393
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	67%
IMG OID	642713340
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001992437
Protein GI	192291832
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGC GGAAGCACGG CCTCACCTAC GCCGACTCCG GCGTCGACAT CGATGCGGGC 
AACCGGCTCG TCGATCTGAT CAAGCCGATG GTGCGCGCCA CTGCGCGGGC CGGCGCGGAT 
TCCGAGATCG GCGGCTTCGG CGGCCTGTTC GATCTGAAGG CGGCGGGCTT CAAGGATCCG 
GTGCTGGTCG CCGCCACCGA CGGCGTCGGC ACCAAGATCA AGGTGGCGAT CGACGCCGGG 
CTGCACACCG GCATCGGCAT CGATTTGGTG GCGATGTCGG TCAACGACCT CGTGGTGCAA 
GGCGCCGAGC CGCTGTTCTT TCTCGATTAC TTCGCCTGCG GCAAGCTCGA TCCGGAGGCC 
GCGGCCGAGA TCGTCGCCGG CGTGGCCGAA GCCTGCCGCG AGTCCGGCTG CGCACTGATC 
GGCGGCGAGA CCGCCGAAAT GCCGGGCCTG TATAAGGACG GCGACTACGA CCTGGCCGGT 
TTCTCGGTCG GCGCCGCCGA GCGCGGCACG CTGCTGCCGT CGAAGGGCAT CGCCGAAGGT 
GATGCGGTGA TCGGACTGGC GTCCTCCGGC GTGCACTCCA ACGGCTTCTC GCTGGTCCGC 
AAGATCGTCG AGAAATCCGG CCTGCCCTAT GACGCGCCGG CGCCGTTTTC GCCGGTGATG 
ACGCTCGGCG GTGCGCTGCT CGCGCCGACC AAGCTCTATG TGAAGTCCTG CTTGCAGGCG 
ATCCGCGACA CTGGCGCCGT CAAAGGCCTC GCCCACATCA CCGGCGGCGG CTTCACCGAG 
AACATTCCGC GCGTGCTGCC GAAGCACCTC GGCGTCGGCA TCGACCTGCC GCGGATCCCG 
GTGCTGCCGG TGTTCAAATG GCTCGCCGAG CAAGGCGAGA TCGCCGAACT CGAATTGCTG 
CGCACCTTCA ACTGCGGCAT CGGCATGGTC ATCATCGTCA AGGCCGAGGC CGTCGATCAG 
GTCACCGAGA GCCTCACCGC CAGCGGCGAG AGCGTGCACC TGCTCGGTCA GGTCATTGCC 
GCCAAGGGCG AGCAGCGCGT GGTCTATGAT GGCCACCTCG ACCTCGCCTG GTGA

Protein sequence

MTERKHGLTY ADSGVDIDAG NRLVDLIKPM VRATARAGAD SEIGGFGGLF DLKAAGFKDP 
VLVAATDGVG TKIKVAIDAG LHTGIGIDLV AMSVNDLVVQ GAEPLFFLDY FACGKLDPEA 
AAEIVAGVAE ACRESGCALI GGETAEMPGL YKDGDYDLAG FSVGAAERGT LLPSKGIAEG 
DAVIGLASSG VHSNGFSLVR KIVEKSGLPY DAPAPFSPVM TLGGALLAPT KLYVKSCLQA 
IRDTGAVKGL AHITGGGFTE NIPRVLPKHL GVGIDLPRIP VLPVFKWLAE QGEIAELELL 
RTFNCGIGMV IIVKAEAVDQ VTESLTASGE SVHLLGQVIA AKGEQRVVYD GHLDLAW