Gene Smed_1078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1078
Symbol
ID	5321924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1146958
End bp	1148331
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	64%
IMG OID	640790020
Product	pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase
Protein accession	YP_001326765
Protein GI	150396298
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01349] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0468919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAATCA ACATCACCAT GCCGGCCCTC TCTCCGACGA TGGAAGAAGG CAATCTCGCC 
AAGTGGCTGG TCAAGGAAGG CGATAAGGTC AAATCCGGCG ACGTGATCGC CGAGATCGAG 
ACCGACAAGG CGACGATGGA AGTGGAAGCC GTCGATGAGG GCACGGTCGC CAAAATCGTC 
GTTCCCGCCG GAACCGAAGG CGTCAAGGTC AATGCGTTGA TCGCGGTTCT CGCCGCTGAT 
GGCGAGGACG TTGCCACCGC TGCCAAGGGT GGCAACGGGG CGGCGGGAGA AACCGCCGCA 
ACGAAGCCGC AGGAAACGGC GGAAGCAGCA CCCGCCGCGG CAAAGGCGCC CGCGGAAGCA 
AAGGCACCCG CCGAAGCGAA CGCCCCGCAG GCGGACGCAC CGGCACCGCA AGCAGCCTCG 
CCCACACCGG CCGCAGGCGA CGGGAAGCGG ATCTTTTCTT CGCCGCTGGC GCGCCGCCTC 
GCCAGGGAGG CGGGTATCGA CCTGTCGGCA ATCGCCGGGT CCGGGCCGCA TGGCCGCGTC 
ATCAAGAAGG ATGTCGAGGC CGCCGCTTCC GGCGGTGCCG CCAAGACCGC CGCTGCTCCG 
GCAGCAGCTC CGGCCCCGTC GGCGCCTGCC AAGGGCATGT CGGAAGATGC GGTGTTGAAG 
CTCTTCGAGC CAGGCTCCTA CGAGCTCGTG CCGCATGACG GCATGCGCAA GACGATCGCC 
AAGCGCCTCG TCGAATCGAA GCAGACGATC CCGCATTTCT ACGTCTCGGT CGATTGTGAA 
CTCGACGCGT TGCTGGCACT GCGCGCCCAG CTGAATTCCG CAGCACCTGA AAAAGACGGT 
AAGTCGGTCT ACAAGCTTTC CGTCAACGAC ATGGTGATCA AGGCGTTGGC CCTGGCGCTG 
CGTGACGTCC CGGATGCGAA TGTCTCCTGG ACGGATCAGA ACATGGTCAA GCACAAGCAC 
GCGGATGTCG GCGTTGCCGT CTCCATTCCC GGCGGCCTGA TCACCCCCAT CATCCGCCAG 
GCGGAATTGA AAAGCCTCTC GGCGATTTCC AACGAGATGA AGGACCTCGG CAAGCGGGCG 
AAAGAGCGCA AGCTCAAGCC GGAAGAATAT CAGGGCGGCA CCACGGCCGT CTCCAATATG 
GGCATGATGG GCGTCAAGAA CTTCGCAGCA GTCGTCAATC CGCCGCACGC GACGATCCTC 
GCGGTCGGTG CCGGCGAGGA ACGCGTCGTC GTCAAGAACA AGGAGACGGT CATCGCCAAT 
GTGATGACCG TGACGCTTTC GACGGATCAT CGCTGCGTGG ACGGGGCATT GGGCGCCGAA 
CTGCTCGCCG CCTTCAAGCG CTACATCGAA AGCCCGATGG GCATGCTCGT CTGA

Protein sequence

MPINITMPAL SPTMEEGNLA KWLVKEGDKV KSGDVIAEIE TDKATMEVEA VDEGTVAKIV 
VPAGTEGVKV NALIAVLAAD GEDVATAAKG GNGAAGETAA TKPQETAEAA PAAAKAPAEA 
KAPAEANAPQ ADAPAPQAAS PTPAAGDGKR IFSSPLARRL AREAGIDLSA IAGSGPHGRV 
IKKDVEAAAS GGAAKTAAAP AAAPAPSAPA KGMSEDAVLK LFEPGSYELV PHDGMRKTIA 
KRLVESKQTI PHFYVSVDCE LDALLALRAQ LNSAAPEKDG KSVYKLSVND MVIKALALAL 
RDVPDANVSW TDQNMVKHKH ADVGVAVSIP GGLITPIIRQ AELKSLSAIS NEMKDLGKRA 
KERKLKPEEY QGGTTAVSNM GMMGVKNFAA VVNPPHATIL AVGAGEERVV VKNKETVIAN 
VMTVTLSTDH RCVDGALGAE LLAAFKRYIE SPMGMLV