Gene Tcr_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_2046
Symbol
ID	3761963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	-
Start bp	2257144
End bp	2258457
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	47%
IMG OID	637786795
Product	Thiol-disulfide isomerase and thioredoxins-like
Protein accession	YP_392310
Protein GI	78486385
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0526] Thiol-disulfide isomerase and thioredoxins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0189188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAATA ATACACTGCG TATTGGACTG ATACTCGGAT GGTTTTGCAT CAATGCATTT 
CATGTTGCTG TTGCCGAGGT TCCGCATGAG CATACGCTGG AAGGTGCGTT GGAATCGGAA 
GTGTATACGG CCACCACACC GATTGCGAAT GTGCTGTGGG TGCCTTCCGA GCACGGGGTG 
CTTAAACAAG AACAGGCCTT GGCGGAACAA TTGGCTGAAT CGGGATTTAC TGTGACCATG 
CCAAATCTGT TCGAAAGTTA TTTTCTGCCG GTGGCGTCTA GCAGTCTAAG AAAAATCCCT 
TCCAATATTA TTGAACGTGA AATCGCTCGG CTGCATGCCA GCGACCTTCC GTTGTTTGTG 
ATCAGTTCGA ATGAAGGTGC GGCGCTGGTC ATTAAGGCGC TTGCCTCCTT TCAACAAACG 
TCAACGTCGA TGGTGGGCGT GGTCTTGTTG AACCCCAATC TCTATATTGA AACACCACAA 
GCAGGACAAA AAGCAGAGTA TTGGCCAACG GTATCACAGG TCAATGCGCC GGTGTACATC 
ATTCAGTCTG AGCTATCGCC TTGGCGTTGG CACTTACCTC AGTTACAGCA GCAGCTGAGT 
TTGTCCGGTT CGGATGTTTT TATTCGTTTG ATGCCAAAGG TACGGGATCG TTATTATTTT 
CGTCCGGATG CGCTTCCAGT CGAGCAAAAG CAAGCACAGA CGTTAGCGTC CGATTTGATG 
CAGGCGATGA AAACATTGGC TCCATATTTA CCGGTGTTTC GCGAATCTGC GTTGGCCAAA 
AACGCCTCAC CTGAGGAGAG AAGGAATGGT GTTGCCGTAA CCCAATCCCG CTCTCAGTCA 
ACGGATAAAA CCGGATTGCA ACCTTACTCT GGTACGCAGC AACGCTATCT AAAACTCAAT 
GATATAAACA ATCAATCACA CTCGTTGGAC GCTTATCAAG GCAAGGTGGT TCTGTTGAAT 
TTTTGGGCAA GTTGGTGTCC ACCCTGTGTG CATGAAATCC CTTCGATGAC ACGATTGAAA 
ACGGTGTTGA AAGACCAACC GTTTGAAATT CTGGCGGCGA ATTTGGCAGA AGAAAAATCC 
GATATTCAAG CTTTTTTAAA GCAACACCCG GTCAATTTTC CGATCTTACT TGATCCGAAA 
GGATCCGCCG TGCAGGCTTG GCAGGTTTTT GCTTATCCAA GTTCTTACCT GATCGATGGC 
AACGGCAAAA TTCGTTATGC CTTATTTGGT GGGCATGAAT GGGATGATCC GCTGACGGTA 
CAGAAAATCC AATCACTTAT TCACAAAACG ACGACTTCCA CGAAGACACC ATGA

Protein sequence

MLNNTLRIGL ILGWFCINAF HVAVAEVPHE HTLEGALESE VYTATTPIAN VLWVPSEHGV 
LKQEQALAEQ LAESGFTVTM PNLFESYFLP VASSSLRKIP SNIIEREIAR LHASDLPLFV 
ISSNEGAALV IKALASFQQT STSMVGVVLL NPNLYIETPQ AGQKAEYWPT VSQVNAPVYI 
IQSELSPWRW HLPQLQQQLS LSGSDVFIRL MPKVRDRYYF RPDALPVEQK QAQTLASDLM 
QAMKTLAPYL PVFRESALAK NASPEERRNG VAVTQSRSQS TDKTGLQPYS GTQQRYLKLN 
DINNQSHSLD AYQGKVVLLN FWASWCPPCV HEIPSMTRLK TVLKDQPFEI LAANLAEEKS 
DIQAFLKQHP VNFPILLDPK GSAVQAWQVF AYPSSYLIDG NGKIRYALFG GHEWDDPLTV 
QKIQSLIHKT TTSTKTP