Gene EcE24377A_3158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3158
Symbol	lysA
ID	5588244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	3174330
End bp	3175592
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	53%
IMG OID	640926800
Product	diaminopimelate decarboxylase
Protein accession	YP_001464173
Protein GI	157157020
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.856232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACATT CACTGTTCAG CACCGATACC GATCTCACCG CCGAAAATCT GCTGCGTTTG 
CCCGCTGAAT TTGGCTGCCC GGTGTGGGTC TACGATGCGC AAATTATTCG TCGGCAGATT 
GCAGCGCTGA AACAGTTTGA TGTGGTGCGC TTTGCACAGA AAGCCTGTTC CAATATTCAT 
ATTTTGCGAT TAATGCGTGA GCAGGGCGTG AAAGTGGATT CCGTCTCGTT AGGCGAAATA 
GAGCGTGCGT TGGCGGCGGG TTACAATCCG CAAACGCACC CCGATGATAT TGTTTTTACG 
GCAGATGTTA TCGATCAGGC GACGCTTGAA CGCGTCAGTG AATTGCAAAT TCCGGTGAAT 
GCGGGTTCTG TTGATATGCT CGACCAACTG GGCCAGGTTT CGCCAGGGCA TCGGGTATGG 
CTGCGCGTTA ACCCGGGGTT TGGTCACGGA CATAGCCAAA AAACCAATAC CGGTGGCGAA 
AACAGCAAGC ACGGTATCTG GTACACCGAT CTGCCCGCCG CACTGGACGT GATACAACGT 
CATCATTTGC AGCTGGTCGG CATTCACATG CACATTGGTT CTGGCGTTGA TTATGCCCAT 
CTGGAACAGG TGTGTGGTGC TATGGTACGT CAGGTCATCG AATTCGGTCA GGATTTACAG 
GCTATTTCTG CGGGCGGTGG GCTTTCTATT CCTTATCAAC AGGGTGAAGA GGCGGTTGAT 
ACCGAACATT ATTATGGTCT GTGGAATGCC GCGCGTGAGC AAATCGCTCG CCATTTGGGC 
CACCCTGTGA AACTGGAAAT TGAACCGGGT CGCTTTCTGG TAGCGCAGTC TGGCGTGTTA 
ATTACTCAGG TGCGGAGCGT CAAACAAATG GGTAGCCGCC ACTTTGTGCT GGTTGATGCC 
GGGTTCAACG ATCTGATGCG CCCGGCAATG TACGGTAGTT ACCACCATAT CAGTGCCCTG 
GCAGCTGATG GTCGTTCTCT GGAACACGCG CCAACGGTGG AAACCGTCGT CGCCGGGCCA 
TTATGTGAAT CGGGCGATGT CTTTACCCAG CAGGAAGGGG GAAATGTTGA AACCCGCGCC 
TTGCCGGAAG TGAAGGCGGG TGATTATCTG GTACTGCATG ATACAGGGGC ATATGGCGCA 
TCAATGTCAT CCAACTACAA TAGCCGTCCG CTGTTACCAG AAGTTCTGTT TGATAATGGT 
CAGGCGCGGT TGATTCGCCG TCGTCAGACC ATCGAAGAAT TACTGGCGCT GGAATTGCTT 
TAA

Protein sequence

MPHSLFSTDT DLTAENLLRL PAEFGCPVWV YDAQIIRRQI AALKQFDVVR FAQKACSNIH 
ILRLMREQGV KVDSVSLGEI ERALAAGYNP QTHPDDIVFT ADVIDQATLE RVSELQIPVN 
AGSVDMLDQL GQVSPGHRVW LRVNPGFGHG HSQKTNTGGE NSKHGIWYTD LPAALDVIQR 
HHLQLVGIHM HIGSGVDYAH LEQVCGAMVR QVIEFGQDLQ AISAGGGLSI PYQQGEEAVD 
TEHYYGLWNA AREQIARHLG HPVKLEIEPG RFLVAQSGVL ITQVRSVKQM GSRHFVLVDA 
GFNDLMRPAM YGSYHHISAL AADGRSLEHA PTVETVVAGP LCESGDVFTQ QEGGNVETRA 
LPEVKAGDYL VLHDTGAYGA SMSSNYNSRP LLPEVLFDNG QARLIRRRQT IEELLALELL