Gene EcSMS35_2604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2604
Symbol	eutD
ID	6144063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2656790
End bp	2657806
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	58%
IMG OID	641617475
Product	phosphotransacetylase
Protein accession	YP_001744640
Protein GI	170681570
COG category	[C] Energy production and conversion
COG ID	[COG0280] Phosphotransacetylase
TIGRFAM ID	[TIGR00651] phosphate acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTATTG AACGTTGTCG TGAACTGGCG TTGCGAGCGC CCGCCAGAGT GGTTTTTCCG 
GATGCGTTAG ATCAGCGTGT GCTGAAAGCT GCGCAATATT TACATCAACA AGGTCTGGCA 
ACGCCCATTC TGGTCGCTAA TCCGTTTGAA CTTCGTCAGT TTGCGCTCAG TCATGGCGTA 
GCGATGGACG GGCTACAGGT GATTGATCCG CATGGCAACC TCGCAATGCG GGAAGAATTT 
GCTCATCGCT GGCTGGCCCG CGCGGGCGAA AAAACGCCGC CGGATGCGCT GGAAAAACTC 
ACCGAACCGC TGATGTTCGC CGCCGCAATG GTCAGCGCCG GTAAAGCGGA TGTCTGTATC 
GCGGGCAATC TCTCTTCCAC GGCGAATGTG CTGCGTGCCG GATTACGCAT TATTGGCTTG 
CAGCCAGGCT GTAAAACGCT CTCATCCATT TTCCTGATGC TGCCACAGTA CAGCGGTCCG 
GCGTTGGGTT TTGCCGATTG CAGCGTGGTG CCACAGCCGA CGGCGGCGCA GTTGGCGGAT 
ATCGCGCTTG CCAGCGCCGA AACCTGGCGC GCCATCACCG GAGAAGAACC GCGCGTGGCG 
ATGCTGTCGT TTTCCAGCAA CGGTAGTGCC CGTCACCCCT GCGTTGCCAA CGTGCAGCAG 
GCGACAGAAA TCGTCCGTGA GCGCGCACCA AAGCTGGTTG TCGATGGCGA GTTGCAGTTT 
GACGCCGCCT TCGTGCCGGA AGTGGCGGCG CAAAAAGCGC CTGCCAGCCC GCTACAAGGC 
AAGGCCAATG TGATGGTTTT TCCGTCGCTG GAAGCCGGAA ATATTGGCTA CAAAATCGCA 
CAACGACTTG GCGGATATCG TGCCGTCGGG CCATTGATAC AAGGACTTGC CGCGCCGATG 
CACGATCTCT CTCGTGGTTG TAGCGTGCAG GAAATTATCG AACTGGCGCT GGTGGCAGCT 
GTGCCGCGTC AGACAGAAGT GAACCGCGAA AGCAGTTTAC AAACACTGGT TGAATGA

Protein sequence

MIIERCRELA LRAPARVVFP DALDQRVLKA AQYLHQQGLA TPILVANPFE LRQFALSHGV 
AMDGLQVIDP HGNLAMREEF AHRWLARAGE KTPPDALEKL TEPLMFAAAM VSAGKADVCI 
AGNLSSTANV LRAGLRIIGL QPGCKTLSSI FLMLPQYSGP ALGFADCSVV PQPTAAQLAD 
IALASAETWR AITGEEPRVA MLSFSSNGSA RHPCVANVQQ ATEIVRERAP KLVVDGELQF 
DAAFVPEVAA QKAPASPLQG KANVMVFPSL EAGNIGYKIA QRLGGYRAVG PLIQGLAAPM 
HDLSRGCSVQ EIIELALVAA VPRQTEVNRE SSLQTLVE