Gene ECH74115_4107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4107
Symbol	lysA
ID	6969884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3804435
End bp	3805697
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	53%
IMG OID	643387862
Product	diaminopimelate decarboxylase
Protein accession	YP_002272302
Protein GI	209399305
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.475873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.000027959
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCACATT CACTGTTCAG CACCGATACC GATCTCACCG CCGAAAATCT GCTGCGTTTG 
CCCGCTGAAT TTGGCTGCCC GGTGTGGGTC TACGATGCGC AAATTATTCG TCGGCAGATT 
GCAGCGCTGA AACAGTTTGA TGTGGTGCGC TTTGCACAGA AAGCCTGTTC CAATATTCAT 
ATTTTGCGCT TAATGCGTGA GCAGGGCGTG AAAGTGGATT CCGTCTCGTT AGGCGAAATA 
GAGCGTGCGT TGGCGGCGGG TTACAATCCG CAAACGCACC CCGATGATAT TGTTTTTACG 
GCAGATGTTA TCGATCAGGC GACGCTTGAA CGCGTCAGTG AATTGCAAAT TCCGGTGAAT 
GCGGGTTCTG TTGATATGTT CGACCAACTG GGCCAGGTTT CGCCAGGGCA TCGGGTATGG 
CTGCGCGTTA ATCCGGGGTT TGGTCACGGA CATAGCCAAA AAACCAATAC CGGTGGCGAA 
AACAGCAAGC ACGGTATCTG GTACACCGAT CTGCCCGCCG CACTGGACGT GATACAACGT 
CATCATCTGC AGCTGGTCGG CATTCACATG CACATTGGTT CTGGCGTTGA TTATGCCCAT 
CTGGAACAGG TGTGTGGTGC TATGGTGCGT CAGGTCATCG AATTCGGTCA GGATTTACAG 
GCTATTTCTG CGGGCGGTGG GCTTTCTATT CCTTATCAAC AGGGTGAAGA GGCGGTTGAT 
ACCGAACATT ATTATGGTCT GTGGAATGCC GCGCGTGAGC AAATCGCCCG CCATTTGGGC 
CACCCTGTGA AACTGGAAAT TGAACCGGGT CGCTTCCTGG TAGCGCAGTC TGGCGTGTTA 
ATTACTCAGG TGCGGAGCGT CAAACAAATG GGTAGCCGCC ACTTTGTGCT GGTTGATGCC 
GGGTTTAACG ATCTGATGCG CCCGGCAATG TACGGTAGTT ACCACCATAT CAGTGCCCTG 
GCAGCTGATG GTCGTTCTCT GGAACACGCA CCAACGGTGG AAACCGTCGT CGCCGGACCG 
TTATGTGAAT CGGGCGATGT CTTTACCCAG CAGGAAGGGG GAAATGTTGA ACCCCGCGCC 
TTGCCGGAAG TGAAGGCAGG TGATTATCTG GTACTGCATG ATACAGGGGC ATATGGCGCA 
TCAATGTCAT CCAACTACAA TAGCCGTCCG CTGTTACCAG AAGTTCTGTT TGATAATGGT 
CAGGCGCGGT TGATTCGCCG TCGCCAGACC ATCGAAGAAT TACTGGCGCT GGAATTGCTT 
TAA

Protein sequence

MPHSLFSTDT DLTAENLLRL PAEFGCPVWV YDAQIIRRQI AALKQFDVVR FAQKACSNIH 
ILRLMREQGV KVDSVSLGEI ERALAAGYNP QTHPDDIVFT ADVIDQATLE RVSELQIPVN 
AGSVDMFDQL GQVSPGHRVW LRVNPGFGHG HSQKTNTGGE NSKHGIWYTD LPAALDVIQR 
HHLQLVGIHM HIGSGVDYAH LEQVCGAMVR QVIEFGQDLQ AISAGGGLSI PYQQGEEAVD 
TEHYYGLWNA AREQIARHLG HPVKLEIEPG RFLVAQSGVL ITQVRSVKQM GSRHFVLVDA 
GFNDLMRPAM YGSYHHISAL AADGRSLEHA PTVETVVAGP LCESGDVFTQ QEGGNVEPRA 
LPEVKAGDYL VLHDTGAYGA SMSSNYNSRP LLPEVLFDNG QARLIRRRQT IEELLALELL