Gene ECH74115_5836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5836
Symbol	iadA
ID	6967133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5486824
End bp	5487996
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	56%
IMG OID	643389462
Product	isoaspartyl dipeptidase
Protein accession	YP_002273854
Protein GI	209400383
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR01975] isoaspartyl dipeptidase IadA

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.978701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATT ATACCGCAGC CGGTTTTACC CTGCTGCAGG GAGCGCATTT GTATGCGCCG 
GAAGATCGGG GAATTTGCGA TGTCCTCGTC GCTAACGGCA AAATTATCGC CGTTGCCAGT 
AATATCCCTT CTGACATTGT ACCGGACTGC ACGGTTGTCG ATCTCAGCGG GCAGATCCTC 
TGCCCAGGTT TTATTGATCA ACACGTCCAT TTGATTGGCG GTGGCGGCGA AGCAGGTCCC 
ACGACGCGCA CGCCGGAAGT GGCGCTAAGT CGCCTGACGG AAGCGGGCGT CACGTCAGTG 
GTTGGTCTGC TGGGCACCGA CTCTATCTCT CGCCACCCGG AATCCCTGCT CGCCAAGACC 
CGTGCGCTCA ATGAAGAAGG CATCAGCGCC TGGATGCTGA CCGGCGCTTA TCATGTCCCT 
TCCCGCACCA TTACGGGTTC CGTGGAAAAA GACGTGGCGA TTATCGATCG TGTGATTGGC 
GTGAAATGTG CCATCTCTGA TCACCGTTCT GCCGCACCGG ACGTTTATCA CCTGGCTAAT 
ATGGCGGCAG AATCCCGCGT TGGCGGTTTG CTCGGCGGTA AACCTGGCGT CACCGTGTTC 
CACATGGGCG ACAGTAAAAA GGCATTACAG CCTATTTATG ACCTGCTGGA AAACTGCGAT 
GTGCCGATCA GCAAGCTGCT GCCGACCCAC GTTAACCGCA ACGTACCGTT GTTTGAGCAG 
GCGCTGGAGT TCGCGCGCAA AGGCGGCACC ATCGATATCA CCAGCAGCAT TGACGAACCG 
GTCGCCCCTG CCGAAGGTAT TGTCCGCGCC GTTCAGGCGG GTATTCCGCT GGCACGCGTC 
ACCCTCAGCT CCGACGGCAA CGGTAGCCAG CCGTTCTTCG ATGATGAAGG GAATTTAACC 
CATATCGGCG TTGCAGGTTT TGAAACGTTG CTGGAAACCG TGCAGGTGCT GGTTAAAGAC 
TATGATTTCA GTATCAGCGA TGCCCTGCGC CCGCTCACCA GTAGCGTAGC CGGTTTCCTT 
AACCTGACCG GGAAAGGCGA AATTCTGCCA GGCAATGACG CAGACTTACT GGTCATGACG 
CCAGAATTGC GCATTGAGCA GGTATACGCT CGCGGCAAAC TGATGGTCAA AGACGGCAAA 
GCCTGCGTGA AAGGAACGTT TGAAACGGCT TAA

Protein sequence

MIDYTAAGFT LLQGAHLYAP EDRGICDVLV ANGKIIAVAS NIPSDIVPDC TVVDLSGQIL 
CPGFIDQHVH LIGGGGEAGP TTRTPEVALS RLTEAGVTSV VGLLGTDSIS RHPESLLAKT 
RALNEEGISA WMLTGAYHVP SRTITGSVEK DVAIIDRVIG VKCAISDHRS AAPDVYHLAN 
MAAESRVGGL LGGKPGVTVF HMGDSKKALQ PIYDLLENCD VPISKLLPTH VNRNVPLFEQ 
ALEFARKGGT IDITSSIDEP VAPAEGIVRA VQAGIPLARV TLSSDGNGSQ PFFDDEGNLT 
HIGVAGFETL LETVQVLVKD YDFSISDALR PLTSSVAGFL NLTGKGEILP GNDADLLVMT 
PELRIEQVYA RGKLMVKDGK ACVKGTFETA