Gene EcSMS35_2233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2233
Symbol	trxB
ID	6145688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2255295
End bp	2256260
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	53%
IMG OID	641617109
Product	thioredoxin reductase
Protein accession	YP_001744283
Protein GI	170680886
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase
TIGRFAM ID	[TIGR01292] thioredoxin-disulfide reductase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000186252
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCACGA CCAAACACAG TAAACTGCTT ATCCTGGGTT CAGGCCCGGC GGGATACACC 
GCTGCTGTCT ACGCGGCGCG CGCCAACCTG CAACCTGTGC TGATTACCGG CATGGAAAAA 
GGCGGCCAAC TGACCACCAC CACGGAAGTG GAAAACTGGC CTGGCGATCC AAACGATCTG 
ACCGGTCCGT TATTAATGGA GCGCATGCAC GAACATGCCA CCAAATTTGA AACTGAAATC 
ATCTTTGATC ACATCAACAA AGTTGATTTG CAGAATCGTC CGTTCCGTCT GACTGGCGAT 
AGCGGCGAAT ACACTTGCGA CGCGCTGATT ATTGCCACCG GAGCTTCTGC ACGCTATCTC 
GGCCTTCCTT CTGAGGAAGC GTTTAAAGGC CGTGGGGTTT CTGCTTGTGC TACCTGCGAC 
GGTTTCTTCT ATCGCAACCA GAAAGTTGCG GTCATCGGCG GCGGCAATAC CGCGGTTGAA 
GAGGCGCTGT ATCTGTCTAA CATCGCTTCG GAAGTGCATC TGATTCACCG CCGTGACGGT 
TTCCGCGCGG AAAAAATCCT TATTAAGCGT CTGATGGATA AAGTGGAGAA CGGCAACATC 
ATTCTACACA CCAACCGTAC GCTGGAAGAG GTGACCGGCG ATCAGATGGG CGTCACTGGC 
GTTCGTCTGC GCGATACGCA AAACAGCGAT AACATCGAGT CACTCGACGT TGCCGGTCTG 
TTTGTTGCTA TCGGTCACAG CCCGAATACG GCTATTTTCG AAGGGCAGCT GGAACTGGAA 
AACGGCTACA TCAAAGTACA GTCGGGTATT CATGGTAATG CCACCCAGAC CAGCATCCCT 
GGCGTCTTTG CCGCAGGCGA CGTGATGGAT CACATTTATC GCCAGGCTAT TACATCTGCT 
GGTACAGGCT GCATGGCAGC ACTTGATGCG GAACGCTACC TCGATGGTTT AGCTGACGCA 
AAATAA

Protein sequence

MGTTKHSKLL ILGSGPAGYT AAVYAARANL QPVLITGMEK GGQLTTTTEV ENWPGDPNDL 
TGPLLMERMH EHATKFETEI IFDHINKVDL QNRPFRLTGD SGEYTCDALI IATGASARYL 
GLPSEEAFKG RGVSACATCD GFFYRNQKVA VIGGGNTAVE EALYLSNIAS EVHLIHRRDG 
FRAEKILIKR LMDKVENGNI ILHTNRTLEE VTGDQMGVTG VRLRDTQNSD NIESLDVAGL 
FVAIGHSPNT AIFEGQLELE NGYIKVQSGI HGNATQTSIP GVFAAGDVMD HIYRQAITSA 
GTGCMAALDA ERYLDGLADA K