Gene ECH_0735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0735
Symbol	trxB
ID	3927447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	745536
End bp	746492
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	35%
IMG OID	637901854
Product	thioredoxin-disulfide reductase
Protein accession	YP_507537
Protein GI	88658008
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase
TIGRFAM ID	[TIGR01292] thioredoxin-disulfide reductase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAA CATATAATAC AAAAGTTTTA ATTATAGGAT CTGGAGCAGC AGGTTGTACT 
GCTGCTATAT ATGCTGCTCG TGCAAACTTA AAACCTATAT TAATAACTGG AATGTGCCCC 
GGGGGACAGC TTACAATTAC TACAGATGTT GAAAATTTTC CAGGATTTGC ACATGCAGTA 
CAAGGTCCAG ATTTAATGGA ACAAATGAAA CAACAAGCTC ATAACTCCGG AGCTCAGATT 
ATATCTGACG AAATAAAAGA AATACATTCA GATGTATACC CTTTTAAATG TATAGGAATA 
TTTGGTGATC AGTACATTGC AGATAGTATT ATAATTGCAA CAGGAGCTCA AGCAAAATGG 
CTCAACATAA AAAGCGAAGA AACCTTTAAA GGTAGAGGTG TATCTGCATG TGCTACATGT 
GATGGAACGT TTTTCGCTGG TAGTGATATT GCCGTAATAG GAGGAGGTAA TACAGCTGTA 
GAAGAAGCAT TATATCTAAC AAGATATGCA ACAAAAGTAT TTTTAATTCA TAGAAGAGAT 
ACTCTACGTG CTGAACCTAT AATGCAAGAA CGATTATTCA GTAATGATAA AATACAAGTT 
ATATGGAACA GCGTTGTAGA AGAAATACTA GGAAATAAGG AAAGTGGGAA TGTAGAAGCT 
ATAGCATTAA AGTCTGTAAA AACTGGAGAC ATCACTACTA TTTCCGTAAA AGGAGTATTT 
ATTGCTATAG GACATACTCC AAACACACAA ATACTAACAA CCAAAGATAA TGGGAATATA 
GTAGATTTAG ATAACGAAGG ATATATCATT ACTAAACCTG GTAGTACAGT AACTAGTCAC 
CCTGGAATCT TTGCTGCAGG TGATGTACAA GATAAAATAT ATAGACAAGC TGTTGTTGCA 
GCAGGATCTG GGTGTATGGC TGCATTGGAA GCTGCCAAAT TTTTATCAGA GCAATAA

Protein sequence

MTQTYNTKVL IIGSGAAGCT AAIYAARANL KPILITGMCP GGQLTITTDV ENFPGFAHAV 
QGPDLMEQMK QQAHNSGAQI ISDEIKEIHS DVYPFKCIGI FGDQYIADSI IIATGAQAKW 
LNIKSEETFK GRGVSACATC DGTFFAGSDI AVIGGGNTAV EEALYLTRYA TKVFLIHRRD 
TLRAEPIMQE RLFSNDKIQV IWNSVVEEIL GNKESGNVEA IALKSVKTGD ITTISVKGVF 
IAIGHTPNTQ ILTTKDNGNI VDLDNEGYII TKPGSTVTSH PGIFAAGDVQ DKIYRQAVVA 
AGSGCMAALE AAKFLSEQ