Gene BCG9842_B0479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B0479
Symbol	thiI
ID	7181419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	4573622
End bp	4574836
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	39%
IMG OID	643552546
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_002448213
Protein GI	218899802
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.000000040209
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGACAT ATGAATATAT TTTAGTGCGT TACGGAGAAA TGACGACAAA AGGTAAGAAC 
CGTTCTAAAT TTGTAAGCAC ATTAAAAGAT AACGTGAAGT TCAAACTGAA AAAGTTCCCA 
AACATTAAAA TTGATGCAAC GCATGACCGT ATGTACATCC AGTTAAACGG TGAAGATCAT 
GAGGCAATCT CTGAAAGATT GAAAGACGTA TTTGGTATTC ATAAGTTTAA CTTAGCGATG 
AAAGTACCAT CAGAATTAGA AGACATTAAA AAAGGTGCAT TAGCAGCTTT CTTACAAGTA 
AAAGATGATG TGAAAACATT TAAAATTACA GTGCATCGTT CTGATAAGCG CTTCCCAATG 
AAGACGATGG AGTTACTTCC AGAAATCGGT GGGCACATTT TAGAAAATAC AGAGGATATA 
ACAGTAGATG TTCATAATCC AGATGTGAAT GTACGTATAG AAATTCGCAG TGGTTATAGT 
TATATTATGT GTGGTGAGCA CATGGGAGCT GGCGGTTTAC CAGTTGGCGT TGGTGGAAAA 
GTAATGGTAC TTCTTTCTGG TGGTATTGAT AGCCCGGTAG CAGCGTACTT AACGATGAAA 
CGCGGCGTAT CTGTGGAAGC AGTTCACTTC CATAGCCCAC CTTTCACAAG TGAGCGTGCA 
AAACAAAAAG TAATCGATTT AGCACAAGGG TTAACGAAAT ACTGTAAACG TGTAACGCTG 
CACCTTGTTC CGTTTACAGA AGTGCAAAAA ACGATTAATA AAGAAATCCC ATCTAGCTAT 
TCAATGACGG TTATGCGCCG TATGATGATG CGTATTACAG AGCAGATTGC TGAGGAGCGT 
AACGCACTTG CAATTACGAC TGGTGAAAGT CTTGGACAAG TAGCAAGCCA AACATTAGAT 
AGCATGCATA CGATTAACGA AGTAACAAAC TACCCAGTTA TTCGTCCGCT TATTACGATG 
GATAAATTAG AAATTATTAA AATTGCTGAA GAAATCGGCA CGTATGATAT TTCAATTCGT 
CCATACGAAG ATTGCTGTAC AGTATTCACA CCAGCTAGCC CGGCGACGAA GCCGAAGCGT 
GAAAAAGCAA ATCGATTTGA AGCGAAATAC GATTTCACAC CGTTAATCGA AGAAGCTGTA 
GCGAACAAAG AAACAATGGT ATTACAAACG GTTGAAGTAG TGGCGGAAGA AGAAAAATTT 
GAAGAACTTT TCTAA

Protein sequence

MMTYEYILVR YGEMTTKGKN RSKFVSTLKD NVKFKLKKFP NIKIDATHDR MYIQLNGEDH 
EAISERLKDV FGIHKFNLAM KVPSELEDIK KGALAAFLQV KDDVKTFKIT VHRSDKRFPM 
KTMELLPEIG GHILENTEDI TVDVHNPDVN VRIEIRSGYS YIMCGEHMGA GGLPVGVGGK 
VMVLLSGGID SPVAAYLTMK RGVSVEAVHF HSPPFTSERA KQKVIDLAQG LTKYCKRVTL 
HLVPFTEVQK TINKEIPSSY SMTVMRRMMM RITEQIAEER NALAITTGES LGQVASQTLD 
SMHTINEVTN YPVIRPLITM DKLEIIKIAE EIGTYDISIR PYEDCCTVFT PASPATKPKR 
EKANRFEAKY DFTPLIEEAV ANKETMVLQT VEVVAEEEKF EELF