Gene EcDH1_3186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3186
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3427958
End bp	3429406
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	52%
IMG OID
Product	thiamine biosynthesis/tRNA modification protein ThiI
Protein accession	ACX40812
Protein GI	260450390
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.304423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTA TCATTAAATT GTTCCCGGAA ATCACCATCA AAAGCCAATC TGTGCGCTTG 
CGCTTTATAA AAATCCTTAC CGGGAACATT CGTAACGTTT TAAAGCACTA TGATGAGACG 
CTCGCTGTCG TCCGCCACTG GGATAACATC GAAGTTCGCG CAAAAGATGA AAACCAGCGT 
CTGGCTATTC GCGACGCTCT GACCCGTATT CCGGGTATCC ACCATATTCT CGAAGTCGAA 
GACGTGCCGT TTACCGACAT GCACGATATT TTCGAGAAAG CGTTGGTTCA GTATCGCGAT 
CAGCTGGAAG GCAAAACCTT CTGCGTACGC GTGAAGCGCC GTGGCAAACA TGATTTTAGC 
TCGATTGATG TGGAACGTTA CGTCGGCGGC GGTTTAAATC AGCATATTGA ATCCGCGCGC 
GTGAAGCTGA CCAATCCGGA TGTGACTGTC CATCTGGAAG TGGAAGACGA TCGTCTCCTG 
CTGATTAAAG GCCGCTACGA AGGTATTGGC GGTTTCCCGA TCGGCACCCA GGAAGATGTG 
CTGTCGCTCA TTTCCGGTGG TTTCGACTCC GGTGTTTCCA GTTATATGTT GATGCGTCGC 
GGCTGCCGCG TGCATTACTG CTTCTTTAAC CTCGGCGGCG CGGCGCATGA AATTGGCGTG 
CGTCAGGTGG CGCATTATCT GTGGAACCGC TTTGGCAGCT CCCACCGCGT GCGTTTTGTC 
GCTATTAATT TCGAACCGGT CGTCGGGGAA ATTCTCGAGA AAATCGACGA CGGTCAGATG 
GGCGTTATCC TCAAACGTAT GATGGTGCGT GCCGCATCTA AAGTGGCTGA ACGTTACGGC 
GTACAGGCGC TGGTCACCGG CGAAGCGCTC GGCCAGGTGT CCAGCCAGAC GCTGACCAAC 
CTGCGCCTGA TTGATAACGT CTCCGACACG CTGATCCTGC GTCCGCTGAT CTCTTACGAC 
AAAGAGCACA TCATCAACCT GGCCCGCCAG ATTGGCACCG AAGACTTTGC TCGCACGATG 
CCGGAATATT GTGGTGTGAT CTCCAAAAGC CCGACGGTGA AAGCAGTTAA ATCGAAGATT 
GAAGCGGAAG AAGAGAAGTT CGACTTCAGC ATTCTCGATA AAGTGGTTGA GGAAGCGAAT 
AACGTTGATA TCCGCGAAAT CGCCCAGCAG ACCGAGCAGG AAGTGGTGGA AGTGGAAACC 
GTCAATGGCT TCGGCCCGAA CGACGTGATC CTCGATATCC GTTCTATCGA TGAACAGGAA 
GATAAGCCAC TGAAAGTCGA AGGGATTGAT GTGGTTTCTC TGCCGTTCTA TAAACTGAGC 
ACCAAATTTG GCGATCTCGA CCAGAACAAA ACCTGGCTGC TGTGGTGTGA GCGCGGGGTG 
ATGAGCCGTC TGCAGGCGCT CTATCTGCGC GAGCAGGGCT TTAACAATGT GAAGGTATAT 
CGCCCGTAA

Protein sequence

MKFIIKLFPE ITIKSQSVRL RFIKILTGNI RNVLKHYDET LAVVRHWDNI EVRAKDENQR 
LAIRDALTRI PGIHHILEVE DVPFTDMHDI FEKALVQYRD QLEGKTFCVR VKRRGKHDFS 
SIDVERYVGG GLNQHIESAR VKLTNPDVTV HLEVEDDRLL LIKGRYEGIG GFPIGTQEDV 
LSLISGGFDS GVSSYMLMRR GCRVHYCFFN LGGAAHEIGV RQVAHYLWNR FGSSHRVRFV 
AINFEPVVGE ILEKIDDGQM GVILKRMMVR AASKVAERYG VQALVTGEAL GQVSSQTLTN 
LRLIDNVSDT LILRPLISYD KEHIINLARQ IGTEDFARTM PEYCGVISKS PTVKAVKSKI 
EAEEEKFDFS ILDKVVEEAN NVDIREIAQQ TEQEVVEVET VNGFGPNDVI LDIRSIDEQE 
DKPLKVEGID VVSLPFYKLS TKFGDLDQNK TWLLWCERGV MSRLQALYLR EQGFNNVKVY 
RP