Gene ECH74115_5502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5502
Symbol	lysC
ID	6970937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5149498
End bp	5150847
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	54%
IMG OID	643389146
Product	aspartate kinase III
Protein accession	YP_002273543
Protein GI	209399821
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA TTGTTGTCTC CAAATTTGGC GGTACCAGCG TAGCTGATTT TGACGCCATG 
AACCGCAGCG CTGATATTGT GCTTTCTGAT GCCAACGTGC GTTTAGTTGT CCTCTCGGCT 
TCTGCTGGTA TCACTAATCT GCTGGTCGCT TTAGCGGAAG GACTGGAACC TGGCGAGCGA 
TTCGAAAAAC TCGACGCTAT TCGCAACATC CAGTTTGCCA TTCTGGAACG TCTGCGTTAC 
CCGAACGTTA TCCGTGAAGA GATTGAACGT CTGCTGGAGA ACATTACTGT TCTGGCAGAA 
GCGGCGGCGC TGGCAACGTC TCCGGCGCTG ACAGATGAAC TGGTCAGCCA CGGCGAGCTG 
ATGTCGACCC TGCTGTTTGT CGAGATCCTG CGCGAACGCG ATGTTCAGGC ACAGTGGTTT 
GATGTACGTA AAGTGATGCG TACCAACGAC CGATTTGGTC GTGCAGAGCC AGATGTAGCC 
GCGCTGGCGG AACTGGCCGC GCTGCAGCTG CTCCCACGTC TCAATGAAGG CTTAGTGATC 
ACCCAGGGAT TTATCGGTAG CGAAAATAAA GGTCGTACAA CGACGCTTGG CCGTGGAGGC 
AGCGATTATA CGGCAGCCTT GCTGGCGGAG GCTTTACACG CATCTCGTGT TGATATCTGG 
ACCGACGTCC CGGGCATCTA CACCACCGAT CCACGCGTAG TTTCCGCAGC AAAACGCATT 
GATGAAATCG CGTTTGCCGA AGCGGCAGAG ATGGCAACTT TTGGTGCAAA AGTACTGCAT 
CCGGCAACGT TGCTACCCGC AGTACGCAGC GATATCCCAG TCTTTGTCGG CTCCAGCAAA 
GACCCACGCG CAGGTGGTAC GCTGGTGTGC AATAAAACTG AAAATCCGCC GCTGTTCCGC 
GCGCTGGCGC TTCGTCGCAA TCAGACTCTG CTCACTTTGC ACAGCCTGAA TATGCTGCAT 
TCTCGCGGTT TCCTCGCGGA AGTTTTCGGC ATCCTCGCGC GGCATAATAT TTCGGTAGAC 
TTAATCACCA CGTCAGAAGT GAGCGTGGCA TTAACCCTTG ATACCACCGG TTCAACCTCC 
ACTGGCGATA CGTTGCTGAC GCAATCTCTG CTGATGGAGC TTTCCGCACT GTGCCGGGTG 
GAGGTGGAAG AAGGTCTGGC GCTGGTCGCG TTGATTGGCA ATGACCTGTC AAAAGCCTGC 
GGCGTTGGCA AAGAGGTATT CGGCGTACTG GAACCGTTCA ACATTCGCAT GATTTGTTAC 
GGCGCATCCA GCCATAACCT GTGCTTCCTG GTGCCCGGCG AAGATGCCGA GCAGGTGGTG 
CAAAAACTGC ATAGTAATTT GTTTGAGTAA

Protein sequence

MSEIVVSKFG GTSVADFDAM NRSADIVLSD ANVRLVVLSA SAGITNLLVA LAEGLEPGER 
FEKLDAIRNI QFAILERLRY PNVIREEIER LLENITVLAE AAALATSPAL TDELVSHGEL 
MSTLLFVEIL RERDVQAQWF DVRKVMRTND RFGRAEPDVA ALAELAALQL LPRLNEGLVI 
TQGFIGSENK GRTTTLGRGG SDYTAALLAE ALHASRVDIW TDVPGIYTTD PRVVSAAKRI 
DEIAFAEAAE MATFGAKVLH PATLLPAVRS DIPVFVGSSK DPRAGGTLVC NKTENPPLFR 
ALALRRNQTL LTLHSLNMLH SRGFLAEVFG ILARHNISVD LITTSEVSVA LTLDTTGSTS 
TGDTLLTQSL LMELSALCRV EVEEGLALVA LIGNDLSKAC GVGKEVFGVL EPFNIRMICY 
GASSHNLCFL VPGEDAEQVV QKLHSNLFE