Gene Rleg_3968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3968
Symbol
ID	8014782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4043488
End bp	4044750
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	64%
IMG OID	644826537
Product	dihydrolipoamide succinyltransferase
Protein accession	YP_002977748
Protein GI	241206652
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01347] 2-oxoglutarate dehydrogenase complex dihydrolipoamide succinyltransferase (E2 component)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0489345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCAG AAATCCGCGT TCCAACTCTC GGTGAATCCG TCAGCGAGGC AACCGTCGGC 
ACCTGGTTCA AGAAGGTCGG CGACGCCATC AAGGCCGACG AGCCGATTCT CGAGCTTGAA 
ACCGACAAGG TGACCATCGA AGTTCCAGCA CCCGCCTCCG GCACGCTTTC GGAAATCGTC 
GTTGCCGCCG GCGAGACCGT CGGCCTCGGC GCGCTGCTCG GCCAGATCGC TGAAGGTGCT 
GCCGCTGCTG CCGCGCCGGC TGCCGCTGCA CCGGCTGCCG CGCCTGCCCA GCCAGCCCCG 
GCGGCGGCTG CCCAGCCAGC CCCGGTTGCC GCTGCTGCGT CGTCATCGAG CGCCTCCGTC 
TCCACCATGC CGCCTGCACC GGCAGCTTCG AAGATGCTTG CCGAAAACAA CCTTTCCGCC 
GATCAGGTCG ACGGTAGCGG CAAGCGCGGC CAGGTGCTGA AGGGCGACGT CATCGCTGCC 
GTCGCCAAGG GCATTTCCGC CCCGGCCGCC GCACCCGCAG CAACGCCTGC CGCCGCGCGT 
GGTCCGTCGA CGGTCGAGGA TGCCTCGCGC GAAGAGCGCG TGAAGATGAC GCGCCTGCGC 
CAGACGATCG CCAAGCGCCT CAAGGATGCG CAGAACACCG CCGCCATGCT GACCACCTAC 
AACGAGGTGG ACATGAAGGC GGTCATGGAT CTGCGCAACA AGTACAAGGA CATTTTCGAG 
AAGAAGCACG GCGTCAAGCT CGGCTTCATG GGCTTCTTTA CCAAGGCGGT GACGCATGCG 
CTGAAGGAAC TGCCGGCCGT CAATGCCGAA ATCGACGGCA CCGACGTCAT CTACAAGAAC 
TACTGCCATG TCGGCATGGC CGTAGGTACG GACAAAGGCC TCGTCGTTCC CGTCATCCGC 
GACGCCGACC AGATGTCGAT CGCCGAAATC GAGAAGGAAC TCGGCCGTCT TGCCAAGGCA 
GCCCGTGATG GCTCGCTCTC CATGGCCGAC ATGCAGGGCG GCACCTTCAC CATCACCAAT 
GGCGGCGTCT ACGGGTCGCT GATGTCTTCG CCGATCCTCA ACGCGCCGCA GTCCGGCATT 
CTCGGCATGC ACAAGATCCA GGAGCGGCCG GTTGCGATCG GCGGCCAGGT CGTCATCCGT 
CCGATGATGT ATCTGGCGCT GTCCTACGAT CACCGCATCG TCGACGGCAA GGAAGCGGTC 
ACCTTCCTCG TGCGCGTCAA GGAAAGCCTG GAAGATCCGG AACGTCTGGT TCTCGATCTC 
TAA

Protein sequence

MASEIRVPTL GESVSEATVG TWFKKVGDAI KADEPILELE TDKVTIEVPA PASGTLSEIV 
VAAGETVGLG ALLGQIAEGA AAAAAPAAAA PAAAPAQPAP AAAAQPAPVA AAASSSSASV 
STMPPAPAAS KMLAENNLSA DQVDGSGKRG QVLKGDVIAA VAKGISAPAA APAATPAAAR 
GPSTVEDASR EERVKMTRLR QTIAKRLKDA QNTAAMLTTY NEVDMKAVMD LRNKYKDIFE 
KKHGVKLGFM GFFTKAVTHA LKELPAVNAE IDGTDVIYKN YCHVGMAVGT DKGLVVPVIR 
DADQMSIAEI EKELGRLAKA ARDGSLSMAD MQGGTFTITN GGVYGSLMSS PILNAPQSGI 
LGMHKIQERP VAIGGQVVIR PMMYLALSYD HRIVDGKEAV TFLVRVKESL EDPERLVLDL