Gene Smed_3038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3038
Symbol
ID	5323916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3186500
End bp	3187477
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	62%
IMG OID	640791987
Product	transketolase central region
Protein accession	YP_001328699
Protein GI	150398232
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACTT CGATGACGTA CAGAGACGCG CTCCGCAAGG CGCTGGACGA CGCGATGACG 
GATGACAGCT CCATCGTCGT GATCGGCGAG GAAGTGGGCC GCTATGGCGG CGCATACGGG 
GTCACCAAGG ATCTCATCAA GATACATGGG GCCGACCGAC TGATCGATAC GCCGATCTCC 
GAGCCGGCCA TCGTCGGCAC CGCTGTCGGT GCGGCGATGA CGGGCCTGCG CCCGGTCGCA 
GAACTGATGT ATATCGACTT TCTGGGCATG ACCATGGATC AGCTCGCCAA CCAGGCGGCC 
AAGATACGGT ACATGTTCGG CGGCCAGATC GGCGTACCTA TGGTGCTCAG AACCCAGGGC 
GGTACGGGCC GTTCCGCTGG CGCACAGCAT TCGCAGAGCC TCGAAGCCTG GGTGATGCAT 
ACGCCAGGTC TTCGGCTCGC CATGCCGGCA ACGGTCGCCG ATGCCTATCA TCTGCTGCGC 
CAGAGCCTGA CCAAACCGGA TCCGGTGGTC TTCATCGAGC ACAAGGCACT TTATACCCGC 
AAGGAGGAAA TCGACCTCGA CGCAGATCCT TTGCCCTGGG GCAAGGCTGC CGTTCGCCGC 
CAAGGCGACG ATCTCGTCAT CGTCACCTAT TCCCGACAGG TGTTTTACGC ATTGGAAGCG 
GCCGACGCGC TTGCCAGGAA GGGGATCGAA GCGACCGTCA TCGATCTCCG GACGCTGAAT 
CCCCTGGATT TCGATACGGT GCGCGAGCAT GTCGAGCGCG TAGGCAAGGC GATGGTGGTG 
AGCGAAGGGG TGATGACCTC GGGCGTTGCC GCCGAGCTTG CCGCCCGCAT CTCCGAGGAG 
TGTTTCGATT TTCTGGAACA GCCCGTCCTG CGCGTGGCCG GTGAAGACAT CCCGATCTCG 
GTTTCGCAGG AACTCGAGTC CGGCAGCGTG CCTTCCGCAA GGATGATTGC CGATGTTGCC 
GCGAGAATGA TGGCATGA

Protein sequence

MMTSMTYRDA LRKALDDAMT DDSSIVVIGE EVGRYGGAYG VTKDLIKIHG ADRLIDTPIS 
EPAIVGTAVG AAMTGLRPVA ELMYIDFLGM TMDQLANQAA KIRYMFGGQI GVPMVLRTQG 
GTGRSAGAQH SQSLEAWVMH TPGLRLAMPA TVADAYHLLR QSLTKPDPVV FIEHKALYTR 
KEEIDLDADP LPWGKAAVRR QGDDLVIVTY SRQVFYALEA ADALARKGIE ATVIDLRTLN 
PLDFDTVREH VERVGKAMVV SEGVMTSGVA AELAARISEE CFDFLEQPVL RVAGEDIPIS 
VSQELESGSV PSARMIADVA ARMMA