Gene Rpal_4156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4156
Symbol
ID	6411840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4450168
End bp	4451208
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	642714038
Product	6-phosphogluconate dehydrogenase-like protein
Protein accession	YP_001993127
Protein GI	192292522
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1023] Predicted 6-phosphogluconate dehydrogenase
TIGRFAM ID	[TIGR00872] 6-phosphogluconate dehydrogenase (decarboxylating)

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.685432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATCG GCATGATCGG CCTCGGCCGG ATGGGTGGCA ATATCGTCCG GCGCCTGATG 
AAGGATGGCC ATCATGCCGT GGTGTACGAC AGGGACCCGC AAGCGATCGA GGCGCTGACG 
CGCGAAGGCG CAACCGGAGC CGGCGGGCTC GAAGACCTGG TGCGCAAGCT CGACGCGCCG 
CGCGCGGTGT GGGTGATGCT GCCCGCCGGA CAGATCACCG AGACCACCAT CGAACAGCTC 
GCCAAGCTGC TCGCCGCCGG CGACGTCGTC ATCGATGGCG GCAACACCTT CTGGCAGGAC 
GATATCCGCC GCGCCAAGAC GCTGAAGGAA ACCAGCATCG ACTACGTCGA TGTCGGCACC 
TCCGGTGGCA TCTGGGGCTT CGAGCGCGGC TACTGCATGA TGATCGGCGG CGACAAAGCC 
GTCGTCGACC GGCTCGATCC GATCTTCGCC ACACTGGCGC CGGGCATCGG CGACATCCCG 
CGCACGCCGG GCCGCGACGA TCGCGATCCC CGCGTCGAGC AGGGCTATCT GCACGCCGGC 
CCGGTTGGCG CCGGCCATTT CGTCAAAATG GTTCACAACG GCATCGAATA CGGCCTGATG 
CAGGCCTATG CCGAAGGCTT CGACATTCTC AAGAACGCCA GCAGCGACTC CCTGCCCGAA 
GCGCACCGCT TCGATCTCGA CATCGCCGAC ATCGCCGAGG TCTGGCGCCG CGGCAGCGTG 
ATCCCGTCCT GGCTGCTCGA CCTGACAGCA ACGGCGCTGG CGAAAAACGA TCAGCTCGAC 
AACTACTCGG GCTTCGTCGA GGACTCCGGC GAAGGCCGCT GGACCATCAA CGCCGCGATC 
GAAGAAGCGG TGCCGGCCGA AGTGCTCACC GCCGCGCTGT TCGCGCGTTT CCGCTCGCGG 
CGGGACCATA CGTTTGCGGA GAAGATTCTC TCGGCGATGC GGGCGGGCTT CGGCGGCCAC 
AAAGAGCCGC AGCAGCATCC TGAGCCGGAG CAGCAAGCCG CTCCGCAGCA GAAACTGAAA 
CCGAAAGCGG AGCGCGCGTG A

Protein sequence

MQIGMIGLGR MGGNIVRRLM KDGHHAVVYD RDPQAIEALT REGATGAGGL EDLVRKLDAP 
RAVWVMLPAG QITETTIEQL AKLLAAGDVV IDGGNTFWQD DIRRAKTLKE TSIDYVDVGT 
SGGIWGFERG YCMMIGGDKA VVDRLDPIFA TLAPGIGDIP RTPGRDDRDP RVEQGYLHAG 
PVGAGHFVKM VHNGIEYGLM QAYAEGFDIL KNASSDSLPE AHRFDLDIAD IAEVWRRGSV 
IPSWLLDLTA TALAKNDQLD NYSGFVEDSG EGRWTINAAI EEAVPAEVLT AALFARFRSR 
RDHTFAEKIL SAMRAGFGGH KEPQQHPEPE QQAAPQQKLK PKAERA