Gene Smed_0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0749
Symbol
ID	5321586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	803185
End bp	804825
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	66%
IMG OID	640789686
Product	thiamine pyrophosphate binding domain-containing protein
Protein accession	YP_001326440
Protein GI	150395973
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGG TCGGGCTCTA TCTGGTCGAG CTGCTTGCCG CATATGGGGT GGACACAGTG 
TTCGGAATCC CCGGCGTGCA TACCGTCGAG ATGTATCGCG GCTTGCCTCG CAGCGGCATC 
CGCCATTTCA CCCCGCGCCA CGAACAGGGT GCCGGCTTCA TGGCCGATGG TTATGCCCGA 
GCGACCGGGA AGCCCGGAGT GTGCTTCATT ATCTCCGGCC CCGGCCTGAC CAACATCGCC 
ACGGCCATGG CCCAGGCCTA CGGGGATTCT GTCCCGATGC TGGTCATCAC GAGCGTCAAT 
CCTCCCGGCC GCATGGGTTC GGGCGAAGGA CATCTGCACG AACTTCCGGA CCAACGCCAG 
CTTGGCCGCC AGTTCACGGC TTTCAGCCAC ACCATATTGC GGGCGGACGA GCTGGCGCAG 
GTCGTCGCCC GCGCCTTTGC CGTCTTCGCT TCGGCCCGGC CGCGGCCGGT GCATATCGAA 
CTGCCGGTCG ATCTGCTGAC GGCCGATGCT TCGGCCCTGC CGCCGGCACG GAAGCGTCCT 
GTCCCCAGCC GCCCCGCTGC CGAGCCGCAG GCGGTCGCGG CCGCCGCCGC CCTGTGCACG 
GCGGCACTGC GGCCGATCAT CCTGGCCGGC GGCGGCGCCG CCGATGCGGC GGTACCTATG 
CGCCGTCTGG CCGAAGCACT GGACGCCCCC GTGATCATGA CCGTCAACGG ACGCGGCGTC 
CTGCCGGCGG GACATCCGCT CGGCGTTCCC TGCAGCCCTG CTATGGAGGC GACCAGAGCC 
CTCATCGAGA CGGCCGATCT GGTGATCGCG GCAGGCACGG AATTCGGCCC GACGGATTAC 
GATTTTTATG AGACCGGCGG CGCGCGCATC GGCGGCAAAC TGATCCGCAT CGACATCGAT 
GCCGAACAGG CCATGCGCGG GCGACCGGCC GATCAGGCAC TGATATCGGA TGCTGCTCTC 
GCGCTCGAAG CTCTGGCTGC GGCCGTTTCG CCACGCCCGC CGGGTGATGG CGCCGCCCGG 
GCGAAATTAG CACGCAGCGG CGTCCGAAAG GCGCTCAATC CCATTCTGCG TGCAGGTGCT 
CACCTGATGG AAGTGGTGCG CGACACCTTG CCCGGTGTCG TTATCGTCGG CGACTCCGCA 
CAGCCCGTCT ATGCCGGCTG TATCGACTAT GCGGCGACCC GGCCACGATC CTGGTTCTGC 
TCGGCCACCG GCTACGGCAC ACTCGGCTAT GCGCTGCCCG CCGCCACCGG AGCACTGATC 
GGCACCCGCC GGCCAACGGT ATGCCTCATC GGCGATGGCG GCATTCAATT CACACTGCCG 
GAACTTGGTT CCGCCCGCGA GGCAGAGCTG CCACTCATAG TCCTGTTGTG GAACAACAAC 
GGCTATGGCG AGATCAAGAG CTACATGGAA ACACGCGGGA TCGAACCGAT CGGCGTCGAC 
ATCTTCACAC CCGATTTTCT GACCATTTCG CGCGGCTTCG GTTGCGAGGC TCATCGCATG 
AAAGATCACC GCGAGCTGCC GGCCCTCCTG GAGGCCGCGC TGCTGCGCAG ATGCCCCACG 
GTGATAGAGA TCGTCGAGGC AGACTATATT GCGGCTATCA ACGGCCAGGA AGAACCGGCC 
TTACCCGCCG TCGCCGAGTG A

Protein sequence

MKTVGLYLVE LLAAYGVDTV FGIPGVHTVE MYRGLPRSGI RHFTPRHEQG AGFMADGYAR 
ATGKPGVCFI ISGPGLTNIA TAMAQAYGDS VPMLVITSVN PPGRMGSGEG HLHELPDQRQ 
LGRQFTAFSH TILRADELAQ VVARAFAVFA SARPRPVHIE LPVDLLTADA SALPPARKRP 
VPSRPAAEPQ AVAAAAALCT AALRPIILAG GGAADAAVPM RRLAEALDAP VIMTVNGRGV 
LPAGHPLGVP CSPAMEATRA LIETADLVIA AGTEFGPTDY DFYETGGARI GGKLIRIDID 
AEQAMRGRPA DQALISDAAL ALEALAAAVS PRPPGDGAAR AKLARSGVRK ALNPILRAGA 
HLMEVVRDTL PGVVIVGDSA QPVYAGCIDY AATRPRSWFC SATGYGTLGY ALPAATGALI 
GTRRPTVCLI GDGGIQFTLP ELGSAREAEL PLIVLLWNNN GYGEIKSYME TRGIEPIGVD 
IFTPDFLTIS RGFGCEAHRM KDHRELPALL EAALLRRCPT VIEIVEADYI AAINGQEEPA 
LPAVAE