Gene Teth514_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_2024
Symbol
ID	5876497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	-
Start bp	2033480
End bp	2034622
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	33%
IMG OID	641542369
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_001663632
Protein GI	167040647
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGACA TATTATTGAT TAAATATGGA GAATTAGCTT TAAAAGGAGA TAATAGGTCT 
TTTTTTGAAA ATAAATTGAT AAAAAATATA AAACATGCTC TTTCTGACTT TAAGGAAGTT 
AAAGTTGAAA AAACTCATGG CAGAATTTAT GTAGAATGTG ATGGAGATAT TGAAGAGGTA 
ATAGAAAGAT TAAAAAAAGT CTTTGGTATT GTAGGAATAA CAAAAGCTAA AAAAACCGAT 
TTAAACTTGG ATGAAATATT TAAAGCTGCA GTAGAACTTA TGAAAGGACA CGAAGGAAAG 
ACTTTTAAAG TAGAGACTAA GAGGCCAAAT AAGTCTTTTC CTTATAACAG CATGGAGGTC 
AGCCGCAGAG TAGGAGCAGC AGTATTGAAA AATGTCAAAA ACTTAAAAGT AGATGTTCAT 
AATCCTGATG TGCTTTTAAA TGTAGAGATA AGAGAAATGG CTTTTGTATA CGCGGGAGTG 
ATTGAGGGAA TAGGAGGACT TCCTCTTGGG ACAAACGGTA AAGCGACTGT ACTTTTGTCA 
GGAGGAATTG ACAGTCCTGT AGCTGCTTGG ATGATGATGA AAAGAGGCGT AGAAGTAGAA 
GCAGTTTATT TTCACAGCCC TCCTTATACT TCTGAAAGGG CTAAAGACAA AGTTGTAGAT 
TTGTGCAAAG TCCTTTCTCA ATATGGACAA AGGATAAAAT TACACGTAGT TCACTTTACT 
GATTTGCAAT TAGAAATTTA TGAGAAATGT CCACCTAAAT TTACTACTAT AATTATGAGA 
AGAATGATGA TGAAGATAGC AGAAAAAATT GCTCAAAAAA ATGGTTCTAT GGCTCTAATC 
ACAGGGGAAA GTTTAGGACA AGTTGCAAGC CAAACGATTG AAAGTTTATA TGTAACCAAT 
GCTTCTGTCT CTATGCCAAT ATTTAGACCT CTTATTGGGA TGGATAAGAC AGAGATTATA 
GATTTAGCTC AAAAGATTAG TACGTTTGAG ATCTCTATAA GACCCTATGA AGATTGTTGC 
ACTATCTTTG TGCCAAAACA TCCTGCTACA AAGCCAAAAT TAGAAAAAGT AATAGAAGCA 
GAACAAAAAA TGGAGTATCA AAAATACATT GATAATTTTG AAGAAGAGGT TATAGAAGTT 
TAA

Protein sequence

MQDILLIKYG ELALKGDNRS FFENKLIKNI KHALSDFKEV KVEKTHGRIY VECDGDIEEV 
IERLKKVFGI VGITKAKKTD LNLDEIFKAA VELMKGHEGK TFKVETKRPN KSFPYNSMEV 
SRRVGAAVLK NVKNLKVDVH NPDVLLNVEI REMAFVYAGV IEGIGGLPLG TNGKATVLLS 
GGIDSPVAAW MMMKRGVEVE AVYFHSPPYT SERAKDKVVD LCKVLSQYGQ RIKLHVVHFT 
DLQLEIYEKC PPKFTTIIMR RMMMKIAEKI AQKNGSMALI TGESLGQVAS QTIESLYVTN 
ASVSMPIFRP LIGMDKTEII DLAQKISTFE ISIRPYEDCC TIFVPKHPAT KPKLEKVIEA 
EQKMEYQKYI DNFEEEVIEV