Gene RPD_1423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1423
Symbol
ID	4021900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1587385
End bp	1588479
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	67%
IMG OID	637961615
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_568561
Protein GI	91975902
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCTC CCGTTCAGTT GGTGCTCAAA CCCGGCGATA CGATCGGCAT TCTCGGCGGC 
GGCCAGCTCG GCCGGATGCT GGCGATGGCC GCGGCGCGGC TCGGCCTGCG CTGCCATGTG 
TTCTCGCCGG ACCCCGATTC GCCGGCGTTC GACGTGGTGC AGAACGCGAC CTGCGCCGAA 
TATGCCGATG TCGAGGCGCT GGAAATGTTC GCCTCCGACG TCGACGTCAT CACCTACGAA 
TTCGAGAACG TGCCGGCCTC GGCCGCTTTG GTGCTGGCGG CGCGCAAACC CGTGCTGCCC 
GACTACAGGA TCCTGGAGAC CACGCAGGAC CGGCTCGGCG AGAAGGACTT CGTGACCAAG 
CTCGGCATCG GCACAGCCGC TTATGCCGAC GTGACGTCGC CGCAGATGCT GCGTGCCGCG 
ATCGCCAGGC TCGGTCTGCC CGCGGTGCTG AAAACGCGCC GGTTCGGCTA TGACGGCAAG 
GGCCAGATCA TCCTGCGCGA GGGCGACGAC CCCGACGCGG CCTGGGCCAA GCTGGAAACC 
CGCGCAGCGA TTCTCGAGGC GTTCGTGCCC TTCGAGCGCG AGGTATCGGT GATTGCCGCG 
CGTGGCAGCG ACGGCCAGGT GGTGTGTTAC GACGTCACCG AAAACGAGCA CCGCGATCAC 
ATTCTGAAAG TGTCGCGGGT GCCGGCGCCG GTGACCGATG CGGTCGCGGA CGAGGCGCGG 
CGGATCGCCA AAACGATCGC CGACGCGCTG AATTACGTCG GCGTGCTCGG CGTCGAGATG 
TTTGTGGTGC CGGGCGACGG CGGCGCCAGG GTGCTGGTCA ATGAAATCGC CCCGCGCGTG 
CACAATTCCG GTCACTGGAC GCTCGACGGC GCCTCGGTGT CTCAATTCGA ACAGCACATC 
CGGGCGATCG CCGGCTGGCC GCTGGCGGAA CCGCTGCGCC ACGGCCGCGT CACCATGACC 
AATCTGATCG GCCACGACGT CGACGATTAT GCGCGCTGGC TGACGGTCCC GGGCGCCACG 
GTGCATCTTT ACGGCAAGCG GACCGCCCTG CCCGGCCGCA AGATGGGCCA TGTGACGGTG 
ATCGAGCCCC AGTGA

Protein sequence

MTAPVQLVLK PGDTIGILGG GQLGRMLAMA AARLGLRCHV FSPDPDSPAF DVVQNATCAE 
YADVEALEMF ASDVDVITYE FENVPASAAL VLAARKPVLP DYRILETTQD RLGEKDFVTK 
LGIGTAAYAD VTSPQMLRAA IARLGLPAVL KTRRFGYDGK GQIILREGDD PDAAWAKLET 
RAAILEAFVP FEREVSVIAA RGSDGQVVCY DVTENEHRDH ILKVSRVPAP VTDAVADEAR 
RIAKTIADAL NYVGVLGVEM FVVPGDGGAR VLVNEIAPRV HNSGHWTLDG ASVSQFEQHI 
RAIAGWPLAE PLRHGRVTMT NLIGHDVDDY ARWLTVPGAT VHLYGKRTAL PGRKMGHVTV 
IEPQ