Gene RSP_4047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4047
Symbol	pdhAa
ID	3720101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1124389
End bp	1125378
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	65%
IMG OID	640070665
Product	pyruvate dehydrogenase E1 component, alpha subunit
Protein accession	YP_352546
Protein GI	77463042
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03182] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0710149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACCA GAAAATCGCC GGAGCAATCC AACGCATCGA AGGAGGAGCT TGTCCGTTAC 
TACCGCGAGA TGCTCCTGAT CCGCCGCTTC GAAGAGAAGG CGGGCCAACT CTACGGCATG 
GGCCTCATCG GCGGCTTCTG CCATCTCTAC ATCGGCCAGG AAGCCGTGGT GGTCGGCCTC 
GAAGCCGCCG CCAAGGAGGG GGACAAGCGC ATCACCTCCT ACCGCGACCA CGGCCACATG 
CTGGCCTGCG GCATGGATGC CAAGGGCGTG ATGGCCGAGC TCACGGGCCG CGAGGGCGGC 
TATTCGAAGG GCAAGGGCGG CTCGATGCAC ATGTTCTCGA AAGAGAAGCA TTTCTACGGC 
GGCCACGGCA TCGTGGGCGC CCAGGTGCCG CTCGGCGCGG GGCTGGCCTT CGCCGACCGC 
TATCTCGGCA ACGACAATGT CACCTTCACC TATTTCGGCG ACGGTGCCGC GAACCAGGGC 
CAGGTCTACG AGGCCTACAA CATGGCCCGG CTCTGGAGCC TGCCGGTGAT CTTCGTGATC 
GAGAACAACC AGTATGCGAT GGGCACCAGC GTGAAGCGCT CGACGAAATC GCCCTCGCTC 
TGGGAGCGCG GCGCGGCCTA CGGCATCAAG GGCGAGTCGG TGGACGGCAT GGATGTGCTG 
GCCGTGAAGG CCGCGGGCGA GAAGGCGGTC GCCGCCTGCC GCGCGGGCCA GGGGCCCTAC 
ATTCTCGAGA TGATGACCTA CCGCTACCGG GGCCACTCCA TGTCCGACCC GGCCAAATAT 
CGCACCCGCG AGGAAGTCCA GCGGATGCGC GACGAGAAGG ACGCGATCGA ACATGTCCGC 
GACCTGCTGA TCCAGGGCAA TCTCGCGACC GACGACGACC TCAAGGCGAT CGACAAGGAG 
ATCAAGGCCG TGGTGAACGA GGCCGCCGAC TTCGCCAAGG AGAGCCCCGA GCCCGCGCTC 
GAGGAACTCT GGACCGACAT CTACGCCTGA

Protein sequence

MATRKSPEQS NASKEELVRY YREMLLIRRF EEKAGQLYGM GLIGGFCHLY IGQEAVVVGL 
EAAAKEGDKR ITSYRDHGHM LACGMDAKGV MAELTGREGG YSKGKGGSMH MFSKEKHFYG 
GHGIVGAQVP LGAGLAFADR YLGNDNVTFT YFGDGAANQG QVYEAYNMAR LWSLPVIFVI 
ENNQYAMGTS VKRSTKSPSL WERGAAYGIK GESVDGMDVL AVKAAGEKAV AACRAGQGPY 
ILEMMTYRYR GHSMSDPAKY RTREEVQRMR DEKDAIEHVR DLLIQGNLAT DDDLKAIDKE 
IKAVVNEAAD FAKESPEPAL EELWTDIYA