Gene Mext_2789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2789
Symbol
ID	5832131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3127477
End bp	3128889
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	67%
IMG OID	641368591
Product	pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase
Protein accession	YP_001640251
Protein GI	163852208
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01349] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATCA ACGTCCTGAT GCCCGCGCTC TCCCCGACCA TGGAGAAGGG CAACCTCGCC 
AAGTGGCTCA AGAAGGAGGG CGACGCCATC AAGTCCGGCG ACGTCATCGC CGAGATCGAG 
ACCGACAAGG CCACCATGGA GGTCGAGGCG GTCGATGAGG GCGTGCTCGC CAAGATTCTC 
GTGGCCGAAG GCACCGCCGA CGTTCCGGTC AACGAGCTGA TCGCGCTGAT CGCTGAAGAG 
GGTGAGGATC CGGGCAGCGT CCAGGCGCCT AAGGGTGGTG CCGAGGCGAA GACCGCCCCC 
GTCGAGCCGA AGGGCACGCC CGACCAGAAC GCCGCGCCCG ATGGCTCCCA CGCCTCCTAC 
GCGCGCGTCG ATCAGGTGCC CGAAGGTGCC AAGCCGAACG GCGCTGCGCA GCCGGCTGGC 
TCCGGCGATC GCGTCTTCGC CTCGCCGCTC GCGCGCCGCA TCGCGAAGCA GGAAGGCGTC 
GATCTCTCGG CAGTGAAGGG CTCGGGTCCG CATGGCCGCG TGATCCAGCG CGACGTGCAG 
GCGGCGATCG AGAACGGCAC GGCGAAGGCC GATGCGGCGG CCAAGCCCGA GGCCAAATCG 
GAGGCCAAGA GTGCTCCTGC TCCCGAGAAA ACCGCGCCGA AGGCGGCTTC CGGCGGCGGC 
GCCCCGGCCG GGCTCAGCCT CGATCAGGTC AAGGGCTTCT ACGAGAAGGG CAGCTTCGAG 
GAAGTGCCGC TCGACGGCAT GCGCAAGACC ATCGCCAAGC GCCTCACCGA GGCCATGCAG 
GTCGCGCCGC ACTTCTACCT CACCGTCGAT TGCGAACTCG ATGCGCTGAT GAAGCTGCGC 
GAGACGCTCA ACAACTCGGC CGGCAAGGAC AAGGACGGCA AGCCGCTGTT CAAGCTCTCG 
GTGAACGACT TCGTCATCAA GGCGATGGGC CTCGCGCTCA CCCGCGTCCC CGCCGCCAAC 
GCCGTCTGGG CGGAGGACCG CATCCTGCGC TTCACGCACG CCGAGGTCGG CGTCGCGGTG 
GCGATCGATG GCGGCCTATT CACCCCGGTG ATCCGCAAGG CCGACCAGAA GACGCTCTCC 
ACCATCTCCA ACGAGATGAA GGATTTCGCC GGCCGGGCGC GTGCCAAGAA GCTGAAGCCC 
GAGGAGTACC AGGGCGGCGT CACCTCAGTG TCGAACCTCG GCATGTTCGG CATCAAGCAC 
TTCACGGCGG TGATCAACCC GCCGCAATCG AGCATCCTCG CGGTCGGCGC GGGCGAGAAG 
CGCGTGGTGG TGAAGGACGG GCAGCCGACC GTTGCCCAGG TGATGACGGC GACCCTCTCC 
TGCGATCACC GCGTCCTCGA CGGCGCGCTC GGCGCCGAGT TGATCGCGGC CTTCAAGGGA 
CTGATCGAGA ACCCGATGGG GATGCTCGTC TAA

Protein sequence

MPINVLMPAL SPTMEKGNLA KWLKKEGDAI KSGDVIAEIE TDKATMEVEA VDEGVLAKIL 
VAEGTADVPV NELIALIAEE GEDPGSVQAP KGGAEAKTAP VEPKGTPDQN AAPDGSHASY 
ARVDQVPEGA KPNGAAQPAG SGDRVFASPL ARRIAKQEGV DLSAVKGSGP HGRVIQRDVQ 
AAIENGTAKA DAAAKPEAKS EAKSAPAPEK TAPKAASGGG APAGLSLDQV KGFYEKGSFE 
EVPLDGMRKT IAKRLTEAMQ VAPHFYLTVD CELDALMKLR ETLNNSAGKD KDGKPLFKLS 
VNDFVIKAMG LALTRVPAAN AVWAEDRILR FTHAEVGVAV AIDGGLFTPV IRKADQKTLS 
TISNEMKDFA GRARAKKLKP EEYQGGVTSV SNLGMFGIKH FTAVINPPQS SILAVGAGEK 
RVVVKDGQPT VAQVMTATLS CDHRVLDGAL GAELIAAFKG LIENPMGMLV