Gene ECH74115_3679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3679
Symbol	eutD
ID	6970108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3392802
End bp	3393818
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	58%
IMG OID	643387473
Product	phosphotransacetylase
Protein accession	YP_002271926
Protein GI	209400708
COG category	[C] Energy production and conversion
COG ID	[COG0280] Phosphotransacetylase
TIGRFAM ID	[TIGR00651] phosphate acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTATTG AACGTTGTTG TGAACTGGCG TTGCGAGCGC CCGCCAGAGT GGTTTTTCCG 
GATGCGTTAG ATCAACGTGT GCTGAAAGCT GCGCAATATT TACATCAACA AGGTCTGGCA 
ACGCCCATTC TGGTCGCCAA TCCGTTTGAA CTTCGTCAGT TTGCGCTCAG TCACGGCGTG 
GCGATGGACG GGCTACAGGT GATAGATCCG CATGGCAACC TCGCAATGCG GGAAGAATTT 
GCTCATCGCT GGCTGGCCCG CGCGGGCGAA AAAACGCCGC CGGATGCGCT GGAAAAACTT 
ACCGATCCGC TGATGTTCGC CGCCGCAATG GTCAGCGCCG GTAAAGCGGA TGTCTGTATC 
GCGGGCAACC TCTCTTCCAC GGCGAATGTG CTGCGTGCCG GATTACGCAT TATCGGCTTG 
CAGCCAGGCT GTAAAACGCT CTCATCCATT TTCCTGATGC TGCCACAGTA CAGCGGTCCG 
GCGTTGGGCT TTGCCGATTG CAGCGTGGTA CCACAGCCGA CGGCGGCGCA GCTGGCGGAT 
ATCGCGCTTG CCAGCGCCGA AACCTGGCGC GCCATCACCG GAGAAGAGCC GCGCGTGGCG 
ATGCTGTCGT TTTCCAGTAA CGGTAGCGCC CGTCACCCCT GCGTTGCCAA TGTCCAGCAG 
GCGACAGAAA TCGTCCGTGA GCGCGCACCA AAGCTGGTAG TCGATGGCGA GTTGCAGTTT 
GACGCCGCCT TCGTGCCGGA AGTGGCGGCG CAAAAAGCGC CTGCCAGCCC GCTACAGGGC 
AAGGCCAATG TGATGGTTTT TCCGTCGCTG GAAGCCGGAA ATATTGGCTA CAAAATCGCA 
CAACGACTCG GCGGATATCG TGCCGTCGGG CCATTGATAC AAGGACTTGC CGCGCCGATG 
CACGATCTCT CTCGTGGTTG TAGTGTGCAG GAAATTATCG AGCTGGCGCT GGTGGCAGCT 
GTGCCGCGTC AGACAGAAGT GAACCGCGAA AGCAGTTTAC AAACACTGGT TGAATGA

Protein sequence

MIIERCCELA LRAPARVVFP DALDQRVLKA AQYLHQQGLA TPILVANPFE LRQFALSHGV 
AMDGLQVIDP HGNLAMREEF AHRWLARAGE KTPPDALEKL TDPLMFAAAM VSAGKADVCI 
AGNLSSTANV LRAGLRIIGL QPGCKTLSSI FLMLPQYSGP ALGFADCSVV PQPTAAQLAD 
IALASAETWR AITGEEPRVA MLSFSSNGSA RHPCVANVQQ ATEIVRERAP KLVVDGELQF 
DAAFVPEVAA QKAPASPLQG KANVMVFPSL EAGNIGYKIA QRLGGYRAVG PLIQGLAAPM 
HDLSRGCSVQ EIIELALVAA VPRQTEVNRE SSLQTLVE