Gene EcSMS35_4440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4440
Symbol	thiF
ID	6146327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4537352
End bp	4538107
Gene Length	756 bp
Protein Length	251 aa
Translation table	11
GC content	56%
IMG OID	641619260
Product	thiazole biosynthesis adenylyltransferase ThiF
Protein accession	YP_001746376
Protein GI	170680052
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID	[TIGR02356] thiazole biosynthesis adenylyltransferase ThiF, E. coli subfamily

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.000259901
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATGACC GTGACTTTAT GCGTTATAGC CGCCAAATCC TGCTCGACGA TATCGCTCTG 
GACGGGCAGC AAAAACTGCT CGACAGCCAG GTGCTGATTA TTGGTCTTGG CGGGCTGGGT 
ACACCTGCTG CGCTATACCT GGCGGGGGCT GGCGTCGGGA CGCTGGTACT GGCAGATGAC 
GACGATGTGC ATTTAAGCAA TCTGCAACGA CAAATCCTCT TTACCACTGA AGATATCGAT 
CTCCCGAAAT CACAGGTCAG CCAACAGCGA CTGACACAGT TGAATCCCGA CATTCAACTG 
ATGGCATTAC AACAACGATT AACGGGTGAG ACGTTAAAAG ATGCGGTTGC ACAAGCCGAT 
GTGGTGCTCG ACTGTACTGA CAATATGGCG ACTCGCCAGG AGATTAATGC CACCTGCGTG 
GCACTCAACA CGCCGCTTAT CACCGCCAGC GCGGTCGGAT TTGGCGGTCA GTTGATGGTA 
CTGACGCCGC CCTGGGAGCA GGGGTGTTAC CGCTGCCTGT GGCCAGATAA CCAGGAGCCA 
GAACGCAACT GCCGCACGGC GGGCGTGGTT GGCCCGGTGG TCGGGGTTAT GGGCACTTTA 
CAGGCACTGG AAGCCATTAA GTTATTAAGC GGTATAGAGA CGCCTGCGGG AGAACTCCGA 
CTGTTCGACG GTAAATCGAG CCAGTGGCGC AGTCTGACGT TGCGCCGCGC CAGCGGTTGC 
CCGGTATGTG GAGGATGCAA TGCAGATCCT GTTTAA

Protein sequence

MNDRDFMRYS RQILLDDIAL DGQQKLLDSQ VLIIGLGGLG TPAALYLAGA GVGTLVLADD 
DDVHLSNLQR QILFTTEDID LPKSQVSQQR LTQLNPDIQL MALQQRLTGE TLKDAVAQAD 
VVLDCTDNMA TRQEINATCV ALNTPLITAS AVGFGGQLMV LTPPWEQGCY RCLWPDNQEP 
ERNCRTAGVV GPVVGVMGTL QALEAIKLLS GIETPAGELR LFDGKSSQWR SLTLRRASGC 
PVCGGCNADP V