Gene RPC_3871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3871
Symbol
ID	3969370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	4302803
End bp	4303762
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	54%
IMG OID	637926977
Product	phosphoenolpyruvate phosphomutase
Protein accession	YP_533719
Protein GI	90425349
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2513] PEP phosphonomutase and related enzymes
TIGRFAM ID	[TIGR02320] phosphoenolpyruvate phosphomutase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.359309
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGATT GGAAGGCAAA GTATTCAGCA AGCGAAAGTT TGCGCGAACT ACTCCATAAC 
GGCTCGCTAT CATTTGCCAT GGAGGCGCAC AACGGATTGT CGGCAATAAT AGCGGAGAAG 
GCCGGCTTTG AAGTGATTTG GGCCTCGGGG CTGGCGATTT CGGCATCGTT AGGTCTGCGC 
GATTCAAACG AAGCCACGTG GTGTCAGGTT CTAACCATCG CGGAGTTCAT GGCAGATGCC 
GTGGAAATCC CGATTATTCT CGATGGAGAT TCCGGCCACG GAAATTTCAA CACGGTGCGG 
CGCCTTGTCC GGAAAGCCTG CGATCGTCGT ATCGCGGGAG TTTGCTTGGA AGACAAACTT 
TTCCCTAAAA TGAACTCTTT CATCCAAAGC GGACAAATTT TGGCGAACGT CGACGAGTTT 
GCCGGGCGCA TAATGGCAGC GAAGGACACA CAGACTAGCG CCGCGTTTAC CGTCATCGCC 
CGAACTGAGG CACTCATTGC TGGACGATCC CTTGCTGAGG CACTGGATCG TGCCAGTACT 
TATGCTTCGG CGGGCGCCGA TGCGATCGTA ATTCATTCGG CGAAGTCAAC TGCCGACGAA 
GTTCTGGCTT TCGCAGATGC ATGGGCAAAT CGATGCCCGC TGATCATCAT TCCTACAAAA 
TACTATACGA CACCCACGCA GCTTTTTCGA CAAGCGCGTA TCTCTCTGGC AATCTGGGCA 
AATCACTCGC TGCGAGCTTC CGTGGCGTCG ATGCAGGCCG TTTGCAGCCG CATCGTGCGG 
GAGCAGTCGG TCAAGGGCGT CGAACCTAGT ATTTCCAAGC TGGAGACGAT TTTCGATCTT 
CTCAAATATG ATGAGCTTTT GGCCGCTGAA CAGCGGTATT TTCCGGCGAA TGGAGCTTTG 
ACCCCGGGCA TCCCTCGGGT GCCAAAAAAT ATCGTCTCGG CGACGAAGCC GGCAGAATGA

Protein sequence

MADWKAKYSA SESLRELLHN GSLSFAMEAH NGLSAIIAEK AGFEVIWASG LAISASLGLR 
DSNEATWCQV LTIAEFMADA VEIPIILDGD SGHGNFNTVR RLVRKACDRR IAGVCLEDKL 
FPKMNSFIQS GQILANVDEF AGRIMAAKDT QTSAAFTVIA RTEALIAGRS LAEALDRAST 
YASAGADAIV IHSAKSTADE VLAFADAWAN RCPLIIIPTK YYTTPTQLFR QARISLAIWA 
NHSLRASVAS MQAVCSRIVR EQSVKGVEPS ISKLETIFDL LKYDELLAAE QRYFPANGAL 
TPGIPRVPKN IVSATKPAE