Gene Smed_3045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3045
Symbol
ID	5323924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3194321
End bp	3195313
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	65%
IMG OID	640791995
Product	thioredoxin
Protein accession	YP_001328706
Protein GI	150398239
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3118] Thioredoxin domain-containing protein
TIGRFAM ID	[TIGR01068] thioredoxin

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGTA GCGACAATCC CTATCAAGGT TCCTTCGGCA GCCAGATGAC GGGCTCGGCT 
TCCTTCGGTG TACGGCCGGA AAGCGCCGCG GGCGGTCCGA ACGGCTTGAT CCCGGACGAC 
CTGATCAGGG AGACGACGAC CGCCGCCTTC AGTCGCGACG TGCTCGAGGC ATCCCGCCAG 
CAGCCGGTTC TCGTCGATTT CTGGGCGCCT TGGTGTGGTC CATGCAAGCA ACTGACCCCG 
GTCATCGAAA AGGTGGTGAA GGAAGCCGCC GGCCGGGTGA AGCTCGTCAA GATGAACATC 
GACGATCATC CCTCGATTGC GGGCCAGCTC GGTATTCAGT CCATTCCCGC AGTGATCGCC 
TTCGTCGACG GCCGACCGGT TGATGGTTTC ATGGGGGCCG TGCCCGAAAG CCAGATCAAG 
GAGTTCATCG ACCGCATCGC CGGCCCGGGC ACAGACGACG CAACGGCCGA GATCGAGAAT 
GTGCTTGGGG AAGCCAGGGC GCTGCTCGAT GCAGGCGACG CGCAGAACGC CGCCGGCCTC 
TACGGTGCGG TCCTGCAGGC GGATCCGGAG AATGCCACGG CAGTAGCCGG GATGATCGAA 
TGCATGATCG CGCTCGGGCA GCTCGCCGAG GCACGCCAGG CGCTTTCCGG CTTGCCGGAG 
GCGCTCGCCA ATGAAGCGTC CGTCGCTGCC GTCTCGAAAA AGCTCGACCA GATCGAGGAG 
GCCCGCAAGC TCGGTGACCC GACGGCGCTC GAGCGTCAGC TCGCGCTCGA TCCGGATGAC 
CACGGCGCAC GGCTCAAGCT TGCCAAGATC CGCAATGTGG AGGGCGACCG GGCCGCCGCC 
GCCGAACACC TCCTGACCAT CATGAAGCGC GACCGCAGCT TCGAGGACGA CGGCGCCCGG 
CGCGAACTGC TGTCGTTCTT CGAGGTATGG GGGCCGAAGG ATCCGGCAAC GATCGCGGCA 
CGGCGCAAGC TGTCGTCGAT TCTCTTTTCG TAA

Protein sequence

MSGSDNPYQG SFGSQMTGSA SFGVRPESAA GGPNGLIPDD LIRETTTAAF SRDVLEASRQ 
QPVLVDFWAP WCGPCKQLTP VIEKVVKEAA GRVKLVKMNI DDHPSIAGQL GIQSIPAVIA 
FVDGRPVDGF MGAVPESQIK EFIDRIAGPG TDDATAEIEN VLGEARALLD AGDAQNAAGL 
YGAVLQADPE NATAVAGMIE CMIALGQLAE ARQALSGLPE ALANEASVAA VSKKLDQIEE 
ARKLGDPTAL ERQLALDPDD HGARLKLAKI RNVEGDRAAA AEHLLTIMKR DRSFEDDGAR 
RELLSFFEVW GPKDPATIAA RRKLSSILFS