Gene RSP_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4044
Symbol	pgk
ID	3720104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1127213
End bp	1128406
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	69%
IMG OID	640070668
Product	phosphoglycerate kinase
Protein accession	YP_352549
Protein GI	77463045
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0126] 3-phosphoglycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.91232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCTGGA AGACACTCGA CGACATGGAT CTTGCCGGCA AGGTCGTGCT GGTGCGCGTG 
GATGTGAACG TGCCGATGGA AAATGGCGAA GTCACCGACG CCACCCGGAT CGAGAAGATC 
GTCCCCACCG TCGAGGATAT CCTGAAGAAG GGCGGCAAGC CCGTCCTGCT CGCCCATTTC 
GGCCGTCCGA AGGGCAAGGT CGTGGACGAG ATGAGCCTCC GCCTCGTGCT GCCCGCGCTG 
CAGAACGCGC TGCCTGGCAC CAAGGTGAGC TTTGCCGCCG ACTGCGTGGG CCCCGAGCCC 
GAGCAGGCGG TGGCCGCCAT GCTCGAGGGC GAGGTGCTCC TCCTCGAGAA CACCCGCTTC 
CATGCCGGCG AGGAGAAGAA CGACCCCGAG CTGGCCGCCG CGATGGCGAA GCTGGGGCAG 
GTCTATGTCA ACGATGCCTT CTCGGCCGCG CACCGCGCCC ATGCCTCGAC CGAGGGCCTC 
GCCCGTCTTC TGCCCTCGGC CGCCGGCCGG CTGATGGAGG CCGAGCTGAA GGCGCTCGAA 
GCCGCTCTCG GCCATCCCGA GCGCCCCGTT GTGGCCGTGG TGGGCGGGGC CAAGGTCTCG 
ACCAAGCTCG ACCTTCTGGG CAATCTCGTG GGCCGGGTCG ATCATCTGGT GATCGGCGGC 
GGCATGGCCA ACACCTTCCT CGTGGCGCAG GGGATCGAGG TCGGCAAGTC GCTGGCCGAG 
CGCGACATGG CCGATACGGC GCGCGAGATC CTCTCCAAGG CGAAGGCCGC GGGCTGCACG 
ATCCATCTTC CGCTCGATGT GGTGGTGGCG CGCGAGTTCA AGGCGGGGGC CGCGAACGAG 
ACGGTCGAGA CGGCGGCCTG CCCGGCCGAC GCGATGATCC TCGATGCCGG TCCGAAGACC 
GTGGCCGCCC TCTCCGAAGT GTTCGCCTCG GCTAAGACGC TGATCTGGAA CGGCCCGCTC 
GGCGCCTTCG AGATCGAGCC CTTCGACGCC GCGACGAATG CGGCGGCGCT TCAGGTGGCG 
CAGCTCACCA AGGCGGGCCA GCTCATTTCG GTCGCGGGCG GCGGCGATAC GGTGGCCGCC 
CTCAACAAGG CGGGCGCGGC CGAAGGCTTC TCCTACATCT CGACGGCGGG CGGTGCCTTC 
CTCGAATGGA TGGAGGGCAA GGAGCTGCCC GGAGTGGCCG CGCTCACGGT CTGA

Protein sequence

MGWKTLDDMD LAGKVVLVRV DVNVPMENGE VTDATRIEKI VPTVEDILKK GGKPVLLAHF 
GRPKGKVVDE MSLRLVLPAL QNALPGTKVS FAADCVGPEP EQAVAAMLEG EVLLLENTRF 
HAGEEKNDPE LAAAMAKLGQ VYVNDAFSAA HRAHASTEGL ARLLPSAAGR LMEAELKALE 
AALGHPERPV VAVVGGAKVS TKLDLLGNLV GRVDHLVIGG GMANTFLVAQ GIEVGKSLAE 
RDMADTAREI LSKAKAAGCT IHLPLDVVVA REFKAGAANE TVETAACPAD AMILDAGPKT 
VAALSEVFAS AKTLIWNGPL GAFEIEPFDA ATNAAALQVA QLTKAGQLIS VAGGGDTVAA 
LNKAGAAEGF SYISTAGGAF LEWMEGKELP GVAALTV