Gene Athe_1546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1546
Symbol
ID	7409054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1634877
End bp	1636055
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	39%
IMG OID	643715918
Product	thiamine biosynthesis/tRNA modification protein ThiI
Protein accession	YP_002573417
Protein GI	222529535
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAGCAC TACTGATAAG ATACGGTGAG CTTGCGTTAA AAGGTCAAAA TCGTCCTTTT 
TTTGAGGATA CTCTGGTCAG AAATATCAAA AAAAGACTTT CTGACATTGA CTCGGTTATG 
GTTAAAAAGG AGCAGGGCAG AATATTTGTT GAAAATTTGA GTGAGGAATA TTTTGATGAA 
GCAATTGAAA GGCTCAAACG CGTTTTTGGG ATTGTAGGAA TTACCATATG CGAGGTTGCT 
GAAAAGAATT TAGAGGGGAT AAAGCAGGCT GCTGAAGTTG TTACCAAAAG TGAGCTTGAA 
AAGGGTAAGA AGACTTTTAA GGTGGAGACT AAACGAGCAG ATAAAAAATT TGAGCTAAAG 
TCTCCAGAGG TCTCTAAGTT AATAGGCGCG CATATCTTGA GGAAGTTTGC TGAAATGTAT 
GGACTTTCTG TAGATGTTCA CAACCCTGAT TTTACTTTGA ACATAGAAAT AAGAGACAAA 
GTATATATCT ATTCATCAGA AGAGAAAGGT ATTGGAGGAA TGCCCTTTGG CACAGGTGGC 
AGGGCACACC TTCTTTTGTC CGGTGGTATA GACAGTCCTG TTGCCGGTTT TATGATTGCC 
AAAAGAGGTG TTGAGATAGA AGCAATTCAC TTTTACAGTT TTCCTTACAC TGGCGAGAAA 
GCAAAGGAAA AGGTAATAGA CTTGTGTAAG GTTTTGGCAA AATACACAGA TAAGATAAAG 
CTCTATATAG TTCCTTTTAC TGAAATTCAG CTTTCTATTT ATGAAAATTG TGATGAGAGA 
TTCTTGACAA TAATAATGAG AAGATTCATG ATGAAGATTG CACAAAAGAT TGCTATGCAA 
AACGGTGGAC TTGCTTTGAT TACCGGTGAG AGCATAGGTC AGGTTGCAAG CCAGACAATG 
GAAAGTCTGT TTTGCACGCA GGCAGCTGTT TCAATGCCGG TTTTCAGACC GCTCATTGGC 
ATGGACAAGG AAGAGATAAT AAGACTTGCA AAGAAGATTG GCACATATGA TATCTCTATA 
CTTCCTTATG AAGACTGCTG TACTGTGTTT GTTCCTAAGC ATCCAAAAAC CAAACCAAAA 
CTTGAACAAG TTTTGGCTGA GGAAAGCAAG CTCAAGGCAG AAGAACTGAT TGAAAAGGCA 
GTAACAAATA CCGAGTGGAT GGTGATAAGA GATAGGTGA

Protein sequence

MKALLIRYGE LALKGQNRPF FEDTLVRNIK KRLSDIDSVM VKKEQGRIFV ENLSEEYFDE 
AIERLKRVFG IVGITICEVA EKNLEGIKQA AEVVTKSELE KGKKTFKVET KRADKKFELK 
SPEVSKLIGA HILRKFAEMY GLSVDVHNPD FTLNIEIRDK VYIYSSEEKG IGGMPFGTGG 
RAHLLLSGGI DSPVAGFMIA KRGVEIEAIH FYSFPYTGEK AKEKVIDLCK VLAKYTDKIK 
LYIVPFTEIQ LSIYENCDER FLTIIMRRFM MKIAQKIAMQ NGGLALITGE SIGQVASQTM 
ESLFCTQAAV SMPVFRPLIG MDKEEIIRLA KKIGTYDISI LPYEDCCTVF VPKHPKTKPK 
LEQVLAEESK LKAEELIEKA VTNTEWMVIR DR