Gene BURPS1106A_3045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3045
Symbol	trxB
ID	4899503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2974602
End bp	2975564
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	67%
IMG OID	640136271
Product	thioredoxin-disulfide reductase
Protein accession	YP_001067284
Protein GI	126454930
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase
TIGRFAM ID	[TIGR01292] thioredoxin-disulfide reductase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.403048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCACGC CCAAACACGC GAAAGTCCTG ATTCTCGGTT CCGGCCCCGC CGGCTACACG 
GCGGCCGTCT ACGCGGCCCG CGCGAACCTG TCGCCCCTCC TGATCACGGG CATCGCGCAA 
GGCGGCCAGC TGATGACGAC GACCGACGTC GAGAATTGGC CGGCCGACGC GGACGGCGTG 
CAGGGCCCCG AGCTGATGCA GCGCTTTCTC GCGCACGCGC AGCGCTTCAA CACCGAGATC 
GTGTTCGACC ACATCCACAC GGCCAAGCTG CACGAGAAGC CGATCCGCCT GATCGGCGAC 
TCGGGCGAAT ACACGTGCGA CTCGCTGATC ATCGCGACGG GCGCGTCCGC GCAATACCTC 
GGCCTGCAGT CGGAAGAGGC GTTCATGGGC CGCGGCGTGT CGGCGTGCGC GACCTGCGAC 
GGCTTCTTCT ATCGCGGCCA GAACGTCGCG GTCGTCGGCG GCGGCAACAC GGCCGTCGAG 
GAAGCGCTCT ATCTGACGGG CATCGCGAAG AAGGTCACGG TGATCCACCG CCGCGACAAG 
TTCCGCGCGG AGCCGATCCT CGTCGATCGC CTGCTCGAGA AGGAAAAGGA AGGCGCGGTC 
GAGATCAAGT GGGACCATGT GCTCGACGAG GTGACGGGCG ACGATTCGGG CGTCTCGGGC 
GTGCGCATCA AGCACGTGAC GACGGGCGCG ACCGAGGACG TCGCGGTGCA GGGCCTGTTC 
ATCGCGATCG GCCACAAGCC GAACACCGAC ATCTTCAAGG GCCAGCTCGA GATGAAGGAC 
GGCTACATCA TCACGAACAG CGGCCTGTCG GGCAACGCGA CGGGCACGAG CGTGCCGGGC 
GTGTTCGCGG CGGGCGACGT GCAGGACCAC ATCTACCGCC AGGCGATCAC GAGCGCGGGC 
ACGGGCTGCA TGGCGGCGCT CGACGCGCAG CGCTATCTCG AAAGCCTGCA CGACCACAAG 
TAA

Protein sequence

MSTPKHAKVL ILGSGPAGYT AAVYAARANL SPLLITGIAQ GGQLMTTTDV ENWPADADGV 
QGPELMQRFL AHAQRFNTEI VFDHIHTAKL HEKPIRLIGD SGEYTCDSLI IATGASAQYL 
GLQSEEAFMG RGVSACATCD GFFYRGQNVA VVGGGNTAVE EALYLTGIAK KVTVIHRRDK 
FRAEPILVDR LLEKEKEGAV EIKWDHVLDE VTGDDSGVSG VRIKHVTTGA TEDVAVQGLF 
IAIGHKPNTD IFKGQLEMKD GYIITNSGLS GNATGTSVPG VFAAGDVQDH IYRQAITSAG 
TGCMAALDAQ RYLESLHDHK