Gene Smed_2828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2828
Symbol
ID	5323698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2952752
End bp	2954032
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	67%
IMG OID	640791773
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_001328493
Protein GI	150398026
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.288018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAAT TCACCATCAA GATGCCGGAT GTCGGCGAAG GCGTCGCGGA GGCCGAACTC 
GTCGAATGGC ATGTGAAGCC GGGAGACCCG GTACGCGAAG ACATGGTGCT CGCCGCCGTC 
ATGACCGACA AGGCCACGGT CGAAATCCCC TCCCCCGTCT CGGGCAAGGT GCTCTGGCTC 
GGCGCTGAAG TCGGCGACAC GATCGCGGTG AAGGCGCCGC TGGTCAGGAT CGAGACCTCA 
GCTGAGGCGG CAGAGGCTGC TCCGGACAGT GTTCCGGAGG CGCTGGCGGA AAAAGTGCTC 
GACCAGCCCG TCGCCGTCTC TTCCCGATCC GAGGCCGGGG CAGCTGCGCA GGCTAAAAGG 
CCGGCGCCGG AACCTGCTCC GGCGCCCCGC GAAACCCCAA GCTTTTCGGC AAAGCCCCTC 
GCCTCCCCGG CCGTGCGGCT GCGCGCCAGA GAGAGCGGTA TCGACCTCAG GCAGGTAACC 
GGCACAGGGC CGGCAGGCCG GATCACCCAT GAGGATCTCG ACCTCTTCCT CAGCCGGGGC 
GCCGGCCCCG TGGCCGCTCC GGCCGGACTG GTCCGCAAGA CCGCGGTCGA GGAGGTCAAG 
ATGACCGGCC TCAGGCGGCG GATCGCCGAG AAAATGTCGC TCTCCGCGTC GCGCATCCCC 
CACATCACCT ATGTGGAAGA GGTCGACATG ACCGCGCTCG AGGATTTGCG CGCGACGATG 
AACCGCGAGC GCAAGTCCGA ACAGGCCAAG CTGACGATCC TGCCATTCCT GATGCGGGCG 
CTCGTCAGAA CCGCCGCCGA ACTGCCAGGC GTCAATGCCA CATTCGACGA TCATGCCGGC 
ATCATCCATC GTCACTCCGC CGTCCATATC GGCGTCGCCA CCCAGACACC CGCCGGCCTG 
ATGGTTCCGG TGGTCCGCCA TGCCGAGGCG CGCGGGATCT GGGACTGCGC GACCGAGCTC 
AGCCGCCTGG CGGAGGCCGC CCGCACCGGA ACCGCGACGC GCGACGAGCT CACCGGTTCG 
ACCATCACCA TCTCCTCGCT CGGCGCCATT GGCGGGATCG CCTCGACCCC GGTCATCAAC 
CATCCGGAAG TGGCGATCGT CGGCGTCAAC AAGATCGCCG TCCGCCCCGT CTGGGACGGC 
GCGCAATTCG TGCCTCGCAA GATCATGAAT CTCTCGTCGA GCTTCGACCA CCGGGTGATC 
GACGGCTGGG ATGCCGCGGT TTTCGTTCAG CGGCTGAAGA CGCTGATCGA AACGCCGGCG 
CTGATTTTCG TTGAAGGATA G

Protein sequence

MGEFTIKMPD VGEGVAEAEL VEWHVKPGDP VREDMVLAAV MTDKATVEIP SPVSGKVLWL 
GAEVGDTIAV KAPLVRIETS AEAAEAAPDS VPEALAEKVL DQPVAVSSRS EAGAAAQAKR 
PAPEPAPAPR ETPSFSAKPL ASPAVRLRAR ESGIDLRQVT GTGPAGRITH EDLDLFLSRG 
AGPVAAPAGL VRKTAVEEVK MTGLRRRIAE KMSLSASRIP HITYVEEVDM TALEDLRATM 
NRERKSEQAK LTILPFLMRA LVRTAAELPG VNATFDDHAG IIHRHSAVHI GVATQTPAGL 
MVPVVRHAEA RGIWDCATEL SRLAEAARTG TATRDELTGS TITISSLGAI GGIASTPVIN 
HPEVAIVGVN KIAVRPVWDG AQFVPRKIMN LSSSFDHRVI DGWDAAVFVQ RLKTLIETPA 
LIFVEG