Gene ECH74115_3693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3693
Symbol	dapE
ID	6967106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3411848
End bp	3412975
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	53%
IMG OID	643387487
Product	succinyl-diaminopimelate desuccinylase
Protein accession	YP_002271940
Protein GI	209396481
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01246] succinyl-diaminopimelate desuccinylase, proteobacterial clade

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTGCC CGGTTATTGA GCTGACACAA CAGCTTATTC GCCGCCCTTC CCTGAGTCCT 
GATGACGCAG GATGCCAGGC TTTGTTGATT GAACGTTTGC AGGCGATCGG TTTTACCGTT 
GAACGCATGG ACTTTGCCGA TACGCAGAAT TTTTGGGCAT GGCGTGGGCA AGGTGAAACA 
TTGGCCTTTG CCGGGCATAC CGACGTGGTG CCGCCTGGCG ACGCCGATCG TTGGATCAAT 
CCGCCGTTTG AACCAACCAT TCGTGACGGC ATGTTATTCG GGCGCGGTGC GGCAGATATG 
AAAGGCTCGC TGGCGGCGAT GGTGGTAGCT GCAGAACGTT TTGTCGCACA ACATCCCAAC 
CATACAGGGC GACTGGCATT TCTGATCACC TCTGATGAAG AAGCCAGTGC CCACAATGGT 
ACGGTAAAAG CCGTCGAAGC GTTAATGGCA CGTAATGAGC GTCTCGATTA CTGCCTGGTC 
GGCGAACCGT CGAGTATCGA AGTGGTAGGT GATGTGGTGA AAAATGGTCG TCGTGGATCG 
TTAACCTGCA ACCTAACCAT TCATGGCGTT CAGGGGCATG TTGCCTACCC ACATCTGGCT 
GACAATCCGG TACATCGCGC AGCACCTTTC CTTAATGAAT TAGTGGCTAT TGAGTGGGAT 
CAGGGCAATG AATTCTTCCC GGCGACCAGT ATGCAGATTG CCAATATTCA GGCGGGAACG 
GGCAGTAACA ACGTTATTCC GGGTGAACTG TTTGTGCAGT TTAACTTCCG CTTCAGCACC 
GAACTGACTG ATGAGATGAT CAAAGCGCAG GTGCTTGCCC TGCTTGAAAA ACATCAACTG 
CGCTATACGG TGGATTGGTG GCTTTCCGGG CAGCCATTTT TGACCGCGCG CGGTAAACTG 
GTGGATGCGG TCGTTAACGC GGTTGAGCAC TATAATGAAA TTAAACCGCA GCTACTGACC 
ACAGGCGGAA CGTCCGACGG GCGCTTTATT GCCCGCATGG GGGCGCAGGT GGTGGAACTC 
GGGCCGGTCA ATGCCACTAT TCATAAAATT AATGAATGTG TGAACGCTGC CGACCTGCAG 
CTACTTGCCC GTATGTATCA ACGTATCATG GAACAGCTCG TCGCGTGA

Protein sequence

MSCPVIELTQ QLIRRPSLSP DDAGCQALLI ERLQAIGFTV ERMDFADTQN FWAWRGQGET 
LAFAGHTDVV PPGDADRWIN PPFEPTIRDG MLFGRGAADM KGSLAAMVVA AERFVAQHPN 
HTGRLAFLIT SDEEASAHNG TVKAVEALMA RNERLDYCLV GEPSSIEVVG DVVKNGRRGS 
LTCNLTIHGV QGHVAYPHLA DNPVHRAAPF LNELVAIEWD QGNEFFPATS MQIANIQAGT 
GSNNVIPGEL FVQFNFRFST ELTDEMIKAQ VLALLEKHQL RYTVDWWLSG QPFLTARGKL 
VDAVVNAVEH YNEIKPQLLT TGGTSDGRFI ARMGAQVVEL GPVNATIHKI NECVNAADLQ 
LLARMYQRIM EQLVA