Gene ECH74115_4937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4937
Symbol
ID	6966648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4575162
End bp	4576157
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	47%
IMG OID	643388620
Product	acyltransferase family protein
Protein accession	YP_002273047
Protein GI	209400863
COG category	[S] Function unknown
COG ID	[COG3274] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.125366
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCCA AAATTTACTG GATTGATAAC CTGCGAGGGA TAGCGTGTTT AATGGTGGTG 
ATGATTCACA CCACTACCTG GTATGTGACC AATGCTCATA GTGTTAGCCC CGTCACCTGG 
GATATCGCCA ATGTTCTGAA CTCTGCCTCT CGTGTCAGCG TGCCGCTATT TTTCATGATT 
TCCGGCTATC TCTTTTTTGG CGAACGCAGC GCCCAGCCGC GCCATTTCTT GCGTATCGGC 
TTATGTCTGT TTTTTTATAG CGCAATCGCG CTGCTCTACA TTGCACTGTT TACCTCCATT 
AATGTGGAGT TAGCGCTGAA AAACCTGCTG CAAAAGCCAG TGTTTTACCA CTTATGGTTT 
TTCTTCGCGA TTGCGGTGAT TTATCTGGTT TCACCGCTGA TTCAGGTGAA GAACGTCGGC 
GGAAAAATGT TGCTGGTGCT AATGGTGGTG ATTGGTATCA TCGCTAACCC AAACACCGTG 
CCGCAGAAAA TCGACGGTTT TGAATGGCTG CCAATTAACT TATATATCAA TGGCGATACT 
TTTTACTACA TTCTGTATGG CATGTTGGGC CGCGCTTTAG GGATGATGGA CACACAGCAT 
AAAGCACTGT CGTGGGTGAG CGCCGCACTG TTTGCGACGG GAGTTTTTAT TATCTCTCGC 
GGGACATTAT ATGAATTGCA GTGGCGCGGA AATTTTGCCG ATACCTGGTA TCCTTACTGT 
GGGCCGATGG TTTTTATCTG CGCAATCGCG CTATTGACTC TGGTTAAAAA CACGCTGGAT 
ACGCGTACCA TTCGCGGACT TGGCTTAATC TCCCGCCATT CGTTGGGTAT ATACGGATTC 
CACGCCTTGA TTATCCATGC GCTGCGCACC CGGGGAATTG AGCTTAAAAA TTGGCCAATA 
CTGGATATTA TTTGGATTTT TTGCGCGACG TTGGCAGCGA GTTTGTTACT TTCTATGCTG 
GTACAACGAA TCGACAGAAA CAGATTAGTG AGTTAA

Protein sequence

MQPKIYWIDN LRGIACLMVV MIHTTTWYVT NAHSVSPVTW DIANVLNSAS RVSVPLFFMI 
SGYLFFGERS AQPRHFLRIG LCLFFYSAIA LLYIALFTSI NVELALKNLL QKPVFYHLWF 
FFAIAVIYLV SPLIQVKNVG GKMLLVLMVV IGIIANPNTV PQKIDGFEWL PINLYINGDT 
FYYILYGMLG RALGMMDTQH KALSWVSAAL FATGVFIISR GTLYELQWRG NFADTWYPYC 
GPMVFICAIA LLTLVKNTLD TRTIRGLGLI SRHSLGIYGF HALIIHALRT RGIELKNWPI 
LDIIWIFCAT LAASLLLSML VQRIDRNRLV S