Gene ECD_00371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00371
Symbol	thiI
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	406950
End bp	408398
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	52%
IMG OID
Product	thiamine biosynthesis protein ThiI
Protein accession	ACT42270
Protein GI	253976600
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTA TCATTAAATT GTTCCCGGAA ATCACCATCA AAAGCCAATC TGTGCGCTTG 
CGCTTTATAA AAATCCTTAC CGGGAACATT CGTAACGTTT TAAAGCACTA TGATGAGACG 
CTCGCTGTCG TCCGCCACTG GGATAACATC GAAGTTCGCG CGAAAGATGA AAACCAGCGT 
CTGGCTATTC GCGACGCTCT GACCCGTATT CCGGGTATCC ACCATATTCT CGAAGTCGAA 
GACGTGCCGT TTACCGACAT GCACGATATT TTCGAGAAAG CGTTGGTTCA GTACCGCGAT 
CAGCTGGAAG GCAAAACCTT CTGCGTACGC GTGAAGCGTC GTGGCAAACA TGATTTTAGC 
TCGATTGATG TGGAACGTTA CGTCGGCGGC GGTTTAAATC AGCATATTGA GTCCGCGCGC 
GTGAAGCTGA CCAATCCGGA AGTGACTGTC CATCTGGAAG TGGAAGACGA TCGTCTCCTG 
CTGATTAAAG GCCGCTACGA AGGTATTGGC GGTTTCCCGA TCGGCACCCA GGAAGACGTG 
CTGTCGCTCA TTTCCGGTGG TTTCGACTCC GGTGTTTCCA GTTATATGTT GATGCGTCGC 
GGCTGCCGCG TGCATTACTG TTTCTTTAAC CTTGGCGGCG CGGCGCATGA AATTGGCGTG 
CGTCAGGTGG CGCATTATCT GTGGAACCGT TTTGGCAGCT CCCACCGCGT GCGTTTTGTC 
GCTATTAATT TCGAACCGGT CGTTGGGGAA ATTCTCGAGA AAATCGACGA CGGTCAGATG 
GGCGTTATCC TCAAACGTAT GATGGTGCGT GCCGCGTCTA AAGTGGCTGA ACGTTACGGC 
GTACAGGCGC TGGTCACCGG CGAAGCGCTC GGCCAGGTGT CCAGTCAGAC GCTGACCAAC 
CTGCGCCTGA TTGATAACGT CTCTGACACG CTGATCCTGC GTCCGCTGAT TTCTTACGAC 
AAAGAGCACA TCATCAACCT GGCCCGCCAG ATTGGCACTG AAGACTTTGC TCGCACGATG 
CCAGAATATT GTGGCGTGAT CTCCAAAAGC CCGACGGTGA AAGCGGTTAA ATCGAAGATT 
GAAGCGGAAG AAGAGAAGTT CGACTTCAGT ATTCTCGATA AAGTGGTTGA GGAAGCGAAT 
AACGTTGATA TCCGCGAAAT CGCCCAGCAG ACCGAGCAGG AAGTGGTGGA AGTGGAAACC 
GTCAATGGCT TTGGCCCGAA CGACGTGATC CTCGATATCC GTTCTGTCGA TGAGCAGGAA 
GATAAGCCAC TGAAAGTCGA AGGGATTGAC GTGGTTTCTC TGCCGTTCTA TAAACTGAGC 
ACCAAATTTG GCGATCTCGA CCAGAACAGA ACCTGGCTAC TGTGGTGTGA GCGCGGGGTG 
ATGAGCCGTC TGCAGGCGCT CTATCTGCGC GAGCAGGGCT TTAACAATGT GAAGGTGTAT 
CGCCCATAA

Protein sequence

MKFIIKLFPE ITIKSQSVRL RFIKILTGNI RNVLKHYDET LAVVRHWDNI EVRAKDENQR 
LAIRDALTRI PGIHHILEVE DVPFTDMHDI FEKALVQYRD QLEGKTFCVR VKRRGKHDFS 
SIDVERYVGG GLNQHIESAR VKLTNPEVTV HLEVEDDRLL LIKGRYEGIG GFPIGTQEDV 
LSLISGGFDS GVSSYMLMRR GCRVHYCFFN LGGAAHEIGV RQVAHYLWNR FGSSHRVRFV 
AINFEPVVGE ILEKIDDGQM GVILKRMMVR AASKVAERYG VQALVTGEAL GQVSSQTLTN 
LRLIDNVSDT LILRPLISYD KEHIINLARQ IGTEDFARTM PEYCGVISKS PTVKAVKSKI 
EAEEEKFDFS ILDKVVEEAN NVDIREIAQQ TEQEVVEVET VNGFGPNDVI LDIRSVDEQE 
DKPLKVEGID VVSLPFYKLS TKFGDLDQNR TWLLWCERGV MSRLQALYLR EQGFNNVKVY 
RP