Gene RPB_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4039
Symbol
ID	3911846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4609039
End bp	4610691
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	67%
IMG OID	637885943
Product	phosphoglucomutase
Protein accession	YP_487643
Protein GI	86751147
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0033] Phosphoglucomutase
TIGRFAM ID	[TIGR01132] phosphoglucomutase, alpha-D-glucose phosphate-specific

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.425514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCGA AGGTAAGCCC GCTGGCGGGC AAGACCGTCG ACCCCAACAA CCTCGTCAAC 
GTGCCGCGCC TGGTGACGGC GTATTTCGCC GGCAAGCCTG ATCCGAAAGT CGCATCCGAG 
CGCGTCGCGT TCGGCACCTC GGGGCATCGC GGCTCGTCGC TCAACAACGC CTTCAACGAG 
GAGCACATTC TGGCTGTGAG CCAGGCGGTT TGCGACCATC GTGCCGGCGC CGGCATCACC 
GGGCCCTTGT TCATCGGCAT CGACACCCAT GCGCTGGCCG AGCCGGCGCT GGTCAGTGCG 
CTGGAAGTGT TCGCCGCCAA CGGCGTGGAC GTGGTGATCG ACCAGCACGG CGGCTACACG 
CCGACGCCGG TGATCTCCCA CGCGATCCTG ACGCATAATC GCGGCCGCGA CAGCGGCCTC 
GCCGACGGCG TGGTGGTGAC GCCGTCCCAC AATCCGCCGG AAGACGGCGG CTTCAAGTAC 
AATCCGCCGA ACGGCGGCCC GGCCGATACC GACGTGACGT CCGTGATCGA GAAGGCCGCC 
AATGCGCTGC TCGAAGGCGG CCTGAAGGGC GTCAAGCGCA TCCCGTACGA CCGCGCCCGC 
AAGGCCGACA ACGTGCACCG GCGCGACTAC GTCACGCCCT ATGTCGAGGA TCTCGCCAAC 
GTCGTCGACA TGGAGGCGAT CCGCAGCTCC GGCGTCAAGC TCGGCATCGA TCCGCTCGGC 
GGTGCGGCGG TGCATTACTG GCATCCGATC ATCGAGCGCT ACAAGATCGA CGCGAAAGTC 
GTCAGCGACG CGGTCGATCC GACTTTCCGT TTCATGACGC TGGATTGGGA CGGCAAGGTG 
CGGATGGACT GCTCGTCGCC TTATGCGATG GCGCGGCTGA TCGGGATGCG CGACGATTTC 
GACGTCGCCT TCGCCAACGA CACCGACGCC GACCGCCACG GCATCGTCAC CCGCTCCAGC 
GGACTGATGA ACCCCAATCA CTATCTCGCG GTGGCGATCT CCTATCTGTT CGCCAACCGG 
CCAGAATGGG GCGCGGGCGC CGCGATAGGC AAGACCGCGG TGTCGAGCGC GATGATCGAT 
CGCGTCGCCG CCAAGATCGG CCGCAAGGTT GTGGAGACCC CTGTCGGCTT CAAATGGTTC 
GTCGACGGGC TGATCGGCGG CGGCTTCGGC TTCGCCGGCG AGGAAAGCGC CGGCGCCTCG 
TTCCTGCGCC GCGACGGCAG CGTCTGGACC ACCGACAAGG ACGGCGTCAT TCTCGGCCTG 
CTCGCGGCGG AGATCACCGC CAGAAGCAAG GCCGATCCCG GCGAGATCTA TCAGCGCTTG 
ACATCCGAAC TCGGCGCGCC GTTCTACGCG CGCATCGACG CGCCGGCCTC CGCCGCGCAG 
AAGGCGCTGT TCAAGACGCT GACCGCCGAC AAGCTCGGCA TCCGGGAACT CGCCGGCGAG 
CCGGTCACCG CGACGCTGAC CAACGCGCCG GGCAACAACC AGCCGATCGG CGGCGTCAAG 
GTGACGACCG CCAACGGCTG GTTCGCGGCG CGGCCATCGG GCACCGAGGA CGTCTACAAG 
ATCTACGCCG AGAGCTTCGT CAGCGCCGAG CATCTGACGC GCATCCAGCA CGAGGCGCAG 
GCGGCGCTGA GCGCGATGTT CGCGGCAGGT TGA

Protein sequence

MAAKVSPLAG KTVDPNNLVN VPRLVTAYFA GKPDPKVASE RVAFGTSGHR GSSLNNAFNE 
EHILAVSQAV CDHRAGAGIT GPLFIGIDTH ALAEPALVSA LEVFAANGVD VVIDQHGGYT 
PTPVISHAIL THNRGRDSGL ADGVVVTPSH NPPEDGGFKY NPPNGGPADT DVTSVIEKAA 
NALLEGGLKG VKRIPYDRAR KADNVHRRDY VTPYVEDLAN VVDMEAIRSS GVKLGIDPLG 
GAAVHYWHPI IERYKIDAKV VSDAVDPTFR FMTLDWDGKV RMDCSSPYAM ARLIGMRDDF 
DVAFANDTDA DRHGIVTRSS GLMNPNHYLA VAISYLFANR PEWGAGAAIG KTAVSSAMID 
RVAAKIGRKV VETPVGFKWF VDGLIGGGFG FAGEESAGAS FLRRDGSVWT TDKDGVILGL 
LAAEITARSK ADPGEIYQRL TSELGAPFYA RIDAPASAAQ KALFKTLTAD KLGIRELAGE 
PVTATLTNAP GNNQPIGGVK VTTANGWFAA RPSGTEDVYK IYAESFVSAE HLTRIQHEAQ 
AALSAMFAAG