Gene TRQ2_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TRQ2_0139
Symbol
ID	6091541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga sp. RQ2
Kingdom	Bacteria
Replicon accession	NC_010483
Strand	-
Start bp	134832
End bp	136106
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	52%
IMG OID	642487320
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001738183
Protein GI	170287945
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAGA TGGAAATGGC CAGAAAGGGT GTTGTTTCCG ACGAGATGAA AAAGGTGGCG 
GAGTACGAGG GAGTGGATGT CGAGATCGTC AGGCAAAAAC TTGCGGAAGG CAGAGCGGTT 
CTTCCAAAGA ACAAACTCCA CAGGATAGAA AGGCCAATGA TCGTTGGAGA AGGTTTCAGT 
GTGAAGGTGA ACGCGAACAT AGGAACCTCC CAGGGATTTT CTTCGCTCGA AGAGGAAAAG 
GAAAAGGCAA GGGTAGCGAT AGAATACGGT GCTGACTCCC TCATGGTTCT TTCCACGTGG 
GGAGACCTGA GGGAGATCAG AAGGGCCATC GTGGAGATGT CGCCCGTTCC AGTTGGTTCG 
GTGCCCATAT ACGATTCCGC CGTGAGGAGT TACCAGATGA AAAAGAACGT GGTGGATTTT 
TCGGAGAAGG ACTTCTTCGA TATGGTCATA GCACACGCGG AAGATGGCAT AGACTTTATG 
ACGATCCACG TCGGTGTGAC GAGAAGGGTG CTTGATAGGA TAAAAAGTTC AAGGCGGGTT 
TTGAAGATCG TGAGCAGAGG AGGAGCGATC ATCGCGGGAT GGATGATAAA GAACAACAGG 
GAAAATCCGT TCTACGAACA CTTCGATGAA CTCTTGGACA TTGCAAAAGA CTACGATATC 
ACTCTGAGTC TTGGCGACGG CATGAGACCC GGAGCTGTGG TGGATGCGAG CGACGCCCAG 
CAGTTCGAAG AGCTGTTCGT GATGGGGGAA CTCGTGGAGA AAGCGAGGGA AAAAGGGGTC 
CAGGTGATGC TGGAAGGGCC GGGGCACGTT CCACTGAACG AGGTGGAGAT GAACGTGAGG 
CTCATGAAAA AGATCGGAAA AGGAGCCCCC ATCTTCCTTC TGGGACCTCT TCCAACGGAC 
AGAGCCATGG GCTACGATCA CATAGCCTGC GCGATAGGTG GTGCGCTGGC TGGCTACTAC 
GGAGCCGATT TCCTCTGTTA TGTAACTCCT TCAGAGCACA TCTCGCTTCC GGATGTTGAA 
GACGTGAGAG AAGGTGTGAT AGCCTCTAAG ATAGCGGCTA TTGTCGCGGA TGTGGCGCGC 
GGAAACAAAA AAGCCTGGGA GCTTGAGAAA AAGATGGCCC TCGCAAGAAA GAACTTCGAC 
TGGGAGACGA TGTTCAGCCT TTCGCTGGGA AAGGACGTTG CGAAGAAGAA ATACGAGGAA 
AGACCGTACC CCGACAAAGG CTGTTCTATG TGTGGACCAT TCTGTGCGAT AAAGATAGCG 
GAGGAGTTCT CTTGA

Protein sequence

MTQMEMARKG VVSDEMKKVA EYEGVDVEIV RQKLAEGRAV LPKNKLHRIE RPMIVGEGFS 
VKVNANIGTS QGFSSLEEEK EKARVAIEYG ADSLMVLSTW GDLREIRRAI VEMSPVPVGS 
VPIYDSAVRS YQMKKNVVDF SEKDFFDMVI AHAEDGIDFM TIHVGVTRRV LDRIKSSRRV 
LKIVSRGGAI IAGWMIKNNR ENPFYEHFDE LLDIAKDYDI TLSLGDGMRP GAVVDASDAQ 
QFEELFVMGE LVEKAREKGV QVMLEGPGHV PLNEVEMNVR LMKKIGKGAP IFLLGPLPTD 
RAMGYDHIAC AIGGALAGYY GADFLCYVTP SEHISLPDVE DVREGVIASK IAAIVADVAR 
GNKKAWELEK KMALARKNFD WETMFSLSLG KDVAKKKYEE RPYPDKGCSM CGPFCAIKIA 
EEFS