Gene RSP_4050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4050
Symbol	pdhB
ID	3720099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1121645
End bp	1122973
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID	640070663
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_352544
Protein GI	77463040
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01349] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.605618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACCG AGATCCTGAT GCCCGCGCTG TCTCCGACGA TGGAGGAGGG GACGCTCGCG 
AAATGGCTGA AGAAGGAAGG GGATGAGGTC CGCTCGGGCG ACATCATCGC CGAGATCGAG 
ACCGACAAGG CCACCATGGA GTTCGAGGCG GTCGACGAGG GCATCCTCGG CAAGATCCTG 
ATCGCCGAGG GCACGGCAGG CGTGAAGGTC AACACGCCCA TCGCCGTGCT GGTGGAAGAG 
GGCGAGAGCG TGGACGCCGT GTCCTCCGCC AAGGTGCCGG AGCCGCAGGA ACCGGCCGAC 
GAGGCCGCAC CCGCGCAGGG GGCTCCGAAG GAGGCCCCTG CCCCGGCCGC CAAGGCGCCC 
GCGGCGCAGG CGGCCCGATC CGAGGGAGAG CGCGTCTTCG CCTCGCCGCT CGCCCGCCGG 
ATCGCCAAGG AGAAGGGGAT CGACCTTGCC GCGGTGCAGG GCTCGGGCCC GCGCGGCCGG 
ATCGTGAAGG CCGATGTCGA GGGGGCGCAA CCCTCGGCCG CTCCCGCCGC CAAGGCGGAC 
GCCGCGGCAC CGAAGGCAGA AGCGCCCGCC GCTGCGGCCG CGCCCGTCGC CGCGCCGGCC 
GCCTCCGCGG CTTCGGTGGC GAAGCTCTTC GCGGATCGCG ACTATGAGGA AGTGACCCTC 
GACGGGATGC GCAAGACCAT TGCCGCGCGT CTGTCCGAGG CCAAGCAGAC CATCCCGCAC 
TTCTACCTCC GGCGCGAGGT GGCTCTGGAT GCGCTGATGG CTTTCCGCGC CGATCTCAAT 
GCGAAGCTCG AGAGCCGGGG CGTAAAGCTC TCGGTCAACG ACTTCATCAT CAAGGCCTGT 
GCGGTGGCGC TCCAGCAGGT GCCGAACGCG AATGCCGTCT GGGCCGGAGA CCGGATCCTG 
CGGCTGAAGC CCTCGGACGT GGCGGTGGCC GTGGCGATCG AGGGCGGGCT CTTCACGCCG 
GTCCTGCGCG ATGCGCACCA GAAGAGCCTG TCGGCGCTGT CGGCCGAGAT GAAGGATCTC 
GCCGCCCGCG CCCGCACGAA GAAGCTCGCA CCGCACGAAT ATCAGGGCGG CAGCTTCGCG 
ATCTCGAACC TCGGCATGTT CGGGGTCGAG AATTTCGATG CGGTCATCAA CCCGCCGCAC 
GGCTCGATCC TCGCCGTCGG CGCAGGCATC CGCAAGCCGG TGGTGGGCAA GGACGGCGCG 
ATCACGACGG CCACCATGAT GTCGATGACG CTCTCGGTGG ACCACCGGGT GATCGACGGC 
GCGCTGGGGG CCGAGTTCCT GAAGGCGATC GTCGAGAATC TCGAGAACCC GATCGCCATG 
CTGGCCTGA

Protein sequence

MATEILMPAL SPTMEEGTLA KWLKKEGDEV RSGDIIAEIE TDKATMEFEA VDEGILGKIL 
IAEGTAGVKV NTPIAVLVEE GESVDAVSSA KVPEPQEPAD EAAPAQGAPK EAPAPAAKAP 
AAQAARSEGE RVFASPLARR IAKEKGIDLA AVQGSGPRGR IVKADVEGAQ PSAAPAAKAD 
AAAPKAEAPA AAAAPVAAPA ASAASVAKLF ADRDYEEVTL DGMRKTIAAR LSEAKQTIPH 
FYLRREVALD ALMAFRADLN AKLESRGVKL SVNDFIIKAC AVALQQVPNA NAVWAGDRIL 
RLKPSDVAVA VAIEGGLFTP VLRDAHQKSL SALSAEMKDL AARARTKKLA PHEYQGGSFA 
ISNLGMFGVE NFDAVINPPH GSILAVGAGI RKPVVGKDGA ITTATMMSMT LSVDHRVIDG 
ALGAEFLKAI VENLENPIAM LA