Gene Mthe_1173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1173
Symbol
ID	4462638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1257208
End bp	1258491
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	57%
IMG OID	639700190
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_843595
Protein GI	116754477
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAATGC TTGAGGATGC CGCAGCTGGA AGGCTGAATG ACGAGATGAG ACTAGTGGCA 
CAGGCTGAGG GAAAGAGTCC TGAGTTCATA CGCAGAGGCA TTGCAAGCGG AAGAATAGTG 
ATACCCATCT CTCCATACAG AGAGACCAGG CCGGTGGGTA TAGGAAAGGG CCTGCGCACC 
AAGGTGAACG CATCCATAGG CACGAGCTCT GACATCGTGG ATGTGGATAT GGAGGTCGAG 
AAGGCGCGTG TTGCGGAGAG CGCAGGGGCT GACACGCTGA TGGAGCTCTC AACAGGCGGT 
GACCTGCGCG AGATCCGGAG GAGGGTGATA GAGGTGACGA GCCTCAGCGT CGGCAGCGTT 
CCGCTCTATC AGGCATTCAT CGAGGCGATA AGGAAGCACG GCGCAGGCGT TGATATGACA 
GAGGACGAGC TGTTCCGGGC TGTGGATGAG CAGGCGCGGA TGGGCACCAA CTTCATGGCG 
ATACATACAG GAATAAACAG AATCTGCCTG GAGCGCCTGA AGGCGCAGGG CGGCAGGTTC 
GGAGGGCTCT GCAGCCGTGG GGGCGCGTTC ATGATAGCCT GGATGCTTCA TAACGAAAAG 
GAGAACCCTC TGTATAGCGA ATTCGACTAC CTTCTTGAGA TACTGAAGGA GCATGAGGTG 
ACTCTTAGCC TCGGGAACGG CATGCGTGCG GGCGCGATTC ACGACTCGAC GGATAGAGCT 
CAGATACAGG AGCTTGTAAT CAATGCGGAG CTCGCGGACA GAGCGCAGGC GGCAGGCGTC 
CAGACGATCG TCGAGGGGCC GGGGCACATA CCTGTTGATG AGATAGAGGC GAACATAAGG 
ATCATGAAGC GCATGACCGA TGAGCGGCCG TTTTACATGC TGGGTCCTCT GGTGACAGAT 
ATAGCTCCCG GCTACGATCA TATCGTGGCT GCTATTGGGG CGAGCCTGTC CAGCGCATAC 
GGTGCAGACT TCATCTGCTA CGTCACACCT GCGGAGCACC TTGCGCTCCC CACTCCGGAG 
GATGTCAGGG AGGGTGTAAT CGCTGCAAGA ATCGCTGCTT ATATCGGGGA TATGATCAAG 
CTCGGCAGAA GAGACAGGGA TCTGGAGATG GGGAGGGCAA GAAGAGATCT GCTCTGGGAT 
ATGCAGTTTC ACCTGGCACT GGACCCGCAG AGGGCCAGGC AGATCAGGGC TGAGAGAGAG 
CCTGCTGATA GCAGGGTCTG CACGATGTGC GGCGATTACT GCGCTCTGAA GATAATAAAG 
AGCAGCATCA ACCTGAGCAA GTAG

Protein sequence

MGMLEDAAAG RLNDEMRLVA QAEGKSPEFI RRGIASGRIV IPISPYRETR PVGIGKGLRT 
KVNASIGTSS DIVDVDMEVE KARVAESAGA DTLMELSTGG DLREIRRRVI EVTSLSVGSV 
PLYQAFIEAI RKHGAGVDMT EDELFRAVDE QARMGTNFMA IHTGINRICL ERLKAQGGRF 
GGLCSRGGAF MIAWMLHNEK ENPLYSEFDY LLEILKEHEV TLSLGNGMRA GAIHDSTDRA 
QIQELVINAE LADRAQAAGV QTIVEGPGHI PVDEIEANIR IMKRMTDERP FYMLGPLVTD 
IAPGYDHIVA AIGASLSSAY GADFICYVTP AEHLALPTPE DVREGVIAAR IAAYIGDMIK 
LGRRDRDLEM GRARRDLLWD MQFHLALDPQ RARQIRAERE PADSRVCTMC GDYCALKIIK 
SSINLSK