Gene RPB_3197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3197
Symbol
ID	3910998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3655601
End bp	3656677
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	70%
IMG OID	637885099
Product	Ppx/GppA phosphatase
Protein accession	YP_486804
Protein GI	86750308
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.366219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.365881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAGG AGACGCGGCT CCGCGACGGC CTGATGCCCG GCGGAGACAC GCAGCATGAG 
CACGGGTGTG TTGCGAACGC CGAGGAAGAG CATGGGTCGA CGGCGCCGCA TGGCGGCGTC 
TATGCCGCGC TCGACCTCGG CACCAATAAT TGCCGGCTGC TGATCGCGCG GCCGACCGGC 
GACGGCTTTC GCGTGGTCGA TTCGTTTTCC CGGATCATCC GGCTCGGCGA GGGCGTCTCT 
GCCACGGGGC GGATCAGCGA TGCGGCGATC GCTCGGGCGA TCTCCGCGCT GTCGATCTGC 
CGTGACAAGA TCGATCAGCG CAAGGCGAAG CGGCTGCGGC TGATCGCGAC CGAGGCCTGC 
CGTGCCGCCG TCAATGCCGA TGCGTTCTGT GACGCCGTCG CACACGCCAC CGGCATCCGT 
CTCGAAATCA TCGATCGCGA GACCGAGGCG CGGCTGGCGG CGATCGGCTG TTCGCCGCTG 
GTCGATACCG CCGGGCGCGG CGCGATCCTG TTCGATATCG GCGGCGGCTC CAGCGAATTG 
GTGCGGCTCG CGCGCGATCC GGCGCGGCCG GACCTGCCGC CGCGGATCCG GGCCTGGATG 
TCGATTCCGC TCGGCGTGGT GACGCTGGCC GAGCAGTTCG GCGGCAAGGT GGTGACCGCG 
GACAGCTATG CGGCGATGAT CGCGGAGGTC GCCAGGCACG TCGCGCCGTT CGCGGCCGCG 
CATGGCGGCG ACCTCGGCGG CCTGCATCTG CTCGGCACCT CGGGCACGGT GACAACGCTC 
GCGGGGCTGT ATCTCGACCT GATCCGCTAC GATCGCCGCC GCGTCGACGG CATCTGGATG 
AGCGACGCGG AACTGACCGC GACGATCGAC CGGCTGCGCG GCATGAGCTA TCACGATCGC 
GCCCAGAACC ATTGCATCGG CGCCGAGCGC GCCGACCTGG TGCTGGCCGG CTGCGCCATC 
CTCGACGCGG TGCGTGCGGC GTTCCCGCTG CCGCGGCTGC GGGTCGCCGA TCGCGGCCTG 
CGGGAGGGCA TGCTGGTCGA AATGATGCGC GAAGACGGCG TGCCGGGCGT GGCCTGA

Protein sequence

MDEETRLRDG LMPGGDTQHE HGCVANAEEE HGSTAPHGGV YAALDLGTNN CRLLIARPTG 
DGFRVVDSFS RIIRLGEGVS ATGRISDAAI ARAISALSIC RDKIDQRKAK RLRLIATEAC 
RAAVNADAFC DAVAHATGIR LEIIDRETEA RLAAIGCSPL VDTAGRGAIL FDIGGGSSEL 
VRLARDPARP DLPPRIRAWM SIPLGVVTLA EQFGGKVVTA DSYAAMIAEV ARHVAPFAAA 
HGGDLGGLHL LGTSGTVTTL AGLYLDLIRY DRRRVDGIWM SDAELTATID RLRGMSYHDR 
AQNHCIGAER ADLVLAGCAI LDAVRAAFPL PRLRVADRGL REGMLVEMMR EDGVPGVA