Gene Teth514_0974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_0974
Symbol
ID	5875909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	-
Start bp	993893
End bp	995191
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	40%
IMG OID	641541330
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001662611
Protein GI	167039626
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000893445
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAT TGGAATACGC CCTTTCAGGC ATTGTCACAA AAGAGATGAG AATAGTTGCA 
GAGTATGAAG GAGTAGACGA AGAATTTATT TTAGAAGGAG TTAAAAAAGG AGAAATAGTA 
ATACCATCAA ACATCAACCA CAAAAACCTC ATTCCCAAAG GCATAGGAAG GGGTTTATCG 
ACAAAAGTAA ATGCCAATAT AGGAACCTCT GATGCATACC CTGAAATTGA AAAAGAAATT 
GAAAAATTAA ATGTTGCTGT AAAAGCTGGA GCAGATGCGG TAATGGATTT AAGCACAGGG 
GGCGACATTA ACCAATCTCG TAGAAAAATA CTTGAAAATT CCCCTGTCCC TGTAGGCACT 
GTCCCCATGT ATCAAGCAGC TGTAGAATCT ATATCCAAAT ACGGTAGCAT TGTAGCTATG 
CCTGAAGAAT TCATTTTTGA AGTTATAGAA GAACAAGCAA AAGACGGGGT TGATTTTATT 
ACAGTCCACT GTGGTCTAAC ATTTGAATCA TTGAAAAAGC TTAAAGACAA CGGCCGAGTG 
ATGGATATAG TAAGCCGCGG TGGCTCCTTT ACAATTGCTT GGATGCTCCA TAACGACAAA 
GAAAATCCTT TGTATAAACA TTTTGATAGG CTCCTTGATA TTGCTAAAAA ATATGACATA 
ACTCTAAGCT TAGGAGATGG ACTGCGTCCA GGTTGTCTCG AAGACGCTAC AGATAGCGCA 
CAAATTCAAG AGCTCATCAT CCTTGGGGAA CTTGTCAAAA GGGCTCGTAA AGCAGGAGTT 
CAAGTGATGG TAGAAGGACC CGGGCATGTG CCAATTGACC AAATTGAAGC AAATGTAAAA 
CTTCAAAAAC AACTTTGTCA TAATGCTCCT TTTTATGTGC TTGGCCCTAT TGTGACTGAT 
ATAGCTCCTG GTTATGACCA CATAACTTCA GCAATCGGAG GAGCAATTGC AGCAGCTTCT 
GGTGCTGATT TCCTTTGCTA TGTTACACCC GCTGAACATC TCGGACTTCC AGACAAAGAA 
GATGTCAAAG AAGGCGTTAT TGCAGCAAAA ATTGCCGCCC ATGCTGCAGA TATCGCAAAA 
GGCGTAAAAG GTGCTAAAGA AAAAGATTTA ACTATGGCTA GAGCTAGAAA AGCCTTAAAC 
TGGGATGAGC AAATAAAGCT TTCTATAGAC CCTGATAAAG CTTTTAAATA TCGCATCAAT 
AAAAACATAT CTACAGCCAA AACTTGCAGT ATGTGCGGAA AATTCTGCGC TATGAAAATT 
GTCAGTGAGT ACCTTGGAAC TTCAGCTATG ACTTGCTAA

Protein sequence

MTQLEYALSG IVTKEMRIVA EYEGVDEEFI LEGVKKGEIV IPSNINHKNL IPKGIGRGLS 
TKVNANIGTS DAYPEIEKEI EKLNVAVKAG ADAVMDLSTG GDINQSRRKI LENSPVPVGT 
VPMYQAAVES ISKYGSIVAM PEEFIFEVIE EQAKDGVDFI TVHCGLTFES LKKLKDNGRV 
MDIVSRGGSF TIAWMLHNDK ENPLYKHFDR LLDIAKKYDI TLSLGDGLRP GCLEDATDSA 
QIQELIILGE LVKRARKAGV QVMVEGPGHV PIDQIEANVK LQKQLCHNAP FYVLGPIVTD 
IAPGYDHITS AIGGAIAAAS GADFLCYVTP AEHLGLPDKE DVKEGVIAAK IAAHAADIAK 
GVKGAKEKDL TMARARKALN WDEQIKLSID PDKAFKYRIN KNISTAKTCS MCGKFCAMKI 
VSEYLGTSAM TC