Gene Rsph17029_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1147
Symbol
ID	4895466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1188556
End bp	1189884
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID	640111733
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_001043029
Protein GI	126461915
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01349] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.16247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACCG AGATCCTGAT GCCCGCGCTG TCTCCGACGA TGGAGGAGGG GACGCTCGCG 
AAATGGCTGA AGAAGGAAGG GGATGAGGTC CGCTCGGGCG ACATCATCGC CGAGATCGAG 
ACCGACAAGG CCACCATGGA GTTCGAAGCG GTCGACGAGG GCATCCTCGG CAAGATCCTG 
ATCGCCGAGG GCACGGCAGG CGTGAAGGTC AACACGCCCA TCGCCGTGCT GGTGGAAGAG 
GGCGAGAGCG TGGACGCCGT GTCCTCCGCC AAGGTGCCGG AGCCGCAGGA ACCGGCCGAC 
GAGGCCGCGC CCGCGCAGGA GGCTCCGAAG GCGGCCCCTG CCCCGGCCGC CAAGGCGCCC 
GAGGCGCAGG CGGCCCGGTC CGAGGGAGAG CGCGTCTTCG CCTCGCCGCT CGCCCGCCGG 
ATCGCCAAGG AGAAGGGGAT CGACCTTGCC GCGGTGCAGG GCTCGGGCCC CCGCGGCCGG 
ATCGTGAAGG CCGATGTCGA GGGGGCGCGA CCCTCGGCCG CGCCCGCCGC CAAGGCGGAT 
GTCGCGGCAC CGAAGGCAGA AGCGCCCGCC GCTGCGGCCG CGCCCGTCGC CGCGCCGGCC 
GCCTCCGCGG CTTCGGTGGC GAAGCTCTTC GCGGATCGCG ACTATGAGGA AGTGACGCTC 
GACGGGATGC GCAAGACCAT TGCCGCGCGT CTCTCCGAGG CCAAGCAGAC CATCCCGCAC 
TTCTACCTCC GGCGCGAGGT GGCTCTGGAT GCGCTGATGG CCTTCCGCGC CGATCTCAAC 
GCGAAGCTCG AGAGCCGGGG AGTGAAGCTC TCGGTCAACG ACTTCATCAT CAAGGCCTGT 
GCGGTGGCGC TCCAGCAGGT GCCGAACGCG AATGCCGTCT GGGCCGGTGA CCGGATCCTG 
CGGCTGAAGC CCTCGGACGT GGCGGTGGCC GTGGCCATCG AGGGCGGGCT CTTCACGCCG 
GTCCTGCGCG ATGCGCACCA GAAGAGCCTG TCGGCGCTGT CGGCCGAGAT GAAGGATCTC 
GCCGCCCGCG CCCGCACGAA GAAGCTCGCG CCTCACGAAT ATCAGGGCGG CAGCTTCGCG 
ATCTCGAACC TCGGCATGTT CGGGGTGGAG AATTTCGATG CGGTCATCAA CCCGCCGCAC 
GGCTCGATCC TCGCCGTCGG GGCAGGCATC CGCAAGCCGG TGGTGGGCAA GGACGGGGCG 
ATCACGACCG CCACCATGAT GTCGATGACG CTCTCGGTGG ACCACCGGGT GATCGACGGC 
GCGCTGGGGG CCGAGTTCCT GAAGGCGATC GTCGAGAATC TCGAGAACCC GATCGCGATG 
CTGGCCTGA

Protein sequence

MATEILMPAL SPTMEEGTLA KWLKKEGDEV RSGDIIAEIE TDKATMEFEA VDEGILGKIL 
IAEGTAGVKV NTPIAVLVEE GESVDAVSSA KVPEPQEPAD EAAPAQEAPK AAPAPAAKAP 
EAQAARSEGE RVFASPLARR IAKEKGIDLA AVQGSGPRGR IVKADVEGAR PSAAPAAKAD 
VAAPKAEAPA AAAAPVAAPA ASAASVAKLF ADRDYEEVTL DGMRKTIAAR LSEAKQTIPH 
FYLRREVALD ALMAFRADLN AKLESRGVKL SVNDFIIKAC AVALQQVPNA NAVWAGDRIL 
RLKPSDVAVA VAIEGGLFTP VLRDAHQKSL SALSAEMKDL AARARTKKLA PHEYQGGSFA 
ISNLGMFGVE NFDAVINPPH GSILAVGAGI RKPVVGKDGA ITTATMMSMT LSVDHRVIDG 
ALGAEFLKAI VENLENPIAM LA