Gene Mpe_A2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2010
Symbol
ID	4784230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2152917
End bp	2154344
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	66%
IMG OID	640090580
Product	dihydrolipoamide dehydrogenase
Protein accession	YP_001021203
Protein GI	124267199
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR01350] dihydrolipoamide dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.316164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA CTTTCGACGT CGTCGTCATC GGCGGCGGCC CGGGCGGCTA CATCGCTGCC 
ATCCGTGCGG CGCAGCTGGG TTTCAACACC GCCTGCATCG ACGAGTGGAA GAACGACAAG 
GGCGGTCCAG CGCCGGGCGG CACCTGCACG AACGTGGGCT GCATCCCGTC GAAGGCGCTG 
CTGCAGTCGA GCGAGCACTT CGAACACGCC GGCCATGCGT TCGCCGACCA CGGCATCGGA 
CTGAAGGATC TGAGCATCGA CGTCGCGAAG ATGCTGGGGC GCAAGGACAC CGTCGTGAAG 
CAGAACAACG ACGGCATCCT CTATCTGTTC AAGAAGAACA AGGTCAGCTT CTTCCACGGC 
CGCGGCTCGT TCGTGAAGGC CGGTGACGCC GGCTACGAGA TCAAGGTCAG CGGCGCCACC 
GAGGACACGC TGATCGGCAA GGACATCATC ATCGCGACCG GCTCGAGTGC ACGTGCGCTG 
CCGGGTGCAC CGTTCGACGA GGAGAGCATC CTCAGCAACG ACGGGGCGCT GCGCATCCCG 
TCGGTGCCGG CGAAGCTGGG CGTCATCGGC TCGGGCGTGA TCGGCCTCGA GATGGGCTCG 
GTGTGGCGCC GCCTGGGCGC CGAGGTGACG GTGCTGGAAG CGCTGCCGAC CTTCCTGGGC 
GCGGTCGACG AACAGATCGC CAAGGAAGCC CAGAAGGCCT TCATGAGGCA GCGCCTGAAG 
ATCGAGCTGG GCGTGAAGAT CAGCGAAGTC AAGAAGGACA AGAAGGGCGT CAGCGTCAGT 
TACACCAGCG CCAAGGGCGA TGCCAAGACG CTGGAAGTCG ACAAGCTGAT CGTGTCGATC 
GGCCGCGTGC CCAACACCAC CGGCCTGAAC GCCGAGGCGG TGGGACTGAA GCTCGACGAG 
CGCGGCGCGA TCGTGGTCGA CGACGACTGC CGCACCAACC TGCCGAAGGT GTGGGCCATC 
GGCGACGTGG TGCGCGGCCC GATGCTCGCC CACAAGGCGG AAGAAGAGGG CGTGGCGGTC 
GCGGAGCGCA TTGCCGGCCA GCATGGACAC GTCAACTTCA ACACCATCCC CTGGGTCATC 
TATACCAGTC CGGAGATCGC CTGGGTCGGC CAGACCGAGC AGCAGCTCAA GGCGGCGGGC 
CGCGCCTACA AGGCCGGAAC CTTCCCGTTC CTGGCCAACG GTCGTGCGCG TGCGCTCGGC 
GACACGACCG GCATGGTGAA GTTCCTGGCG GACGCTGCGA CCGACGAGAT CCTCGGCGTG 
CACATCGTCG GACCGATGGC CAGCGAACTG ATCGCTGAGG CGGTGGTGGC GATGGAGTTC 
AAGGCCAGCG CCGAGGACAT TGCCCGCATC TGCCACGCGC ACCCGTCGCT GTCGGAAGCG 
ACCAAGGAGG CCGCCCTGGC CGTGGACAAG CGCACACTGA ATTTCTGA

Protein sequence

MSKTFDVVVI GGGPGGYIAA IRAAQLGFNT ACIDEWKNDK GGPAPGGTCT NVGCIPSKAL 
LQSSEHFEHA GHAFADHGIG LKDLSIDVAK MLGRKDTVVK QNNDGILYLF KKNKVSFFHG 
RGSFVKAGDA GYEIKVSGAT EDTLIGKDII IATGSSARAL PGAPFDEESI LSNDGALRIP 
SVPAKLGVIG SGVIGLEMGS VWRRLGAEVT VLEALPTFLG AVDEQIAKEA QKAFMRQRLK 
IELGVKISEV KKDKKGVSVS YTSAKGDAKT LEVDKLIVSI GRVPNTTGLN AEAVGLKLDE 
RGAIVVDDDC RTNLPKVWAI GDVVRGPMLA HKAEEEGVAV AERIAGQHGH VNFNTIPWVI 
YTSPEIAWVG QTEQQLKAAG RAYKAGTFPF LANGRARALG DTTGMVKFLA DAATDEILGV 
HIVGPMASEL IAEAVVAMEF KASAEDIARI CHAHPSLSEA TKEAALAVDK RTLNF