Gene EcHS_A2985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2985
Symbol	lysA
ID	5595459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2995958
End bp	2997220
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	53%
IMG OID	640922106
Product	diaminopimelate decarboxylase
Protein accession	YP_001459609
Protein GI	157162291
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACATT CACTGTTCAG CACCGATACC GATCTCACCG CCGAAAATCT GCTGCGTTTG 
CCCGCTGAAT TTGGCTGCCC GGTGTGGGTC TACGATGCGC AAATTATTCG TCGGCAGATT 
GCAGCGCTGA AACAGTTTGA TGTGGTGCGC TTTGCACAGA AAGCCTGTTC CAATATTCAT 
ATTTTGCGCT TAATGCGTGA GCAGGGCGTG AAAGTGGATT CCGTCTCGTT AGGCGAAATA 
GAGCGTGCGT TGGCGGCGGG TTACAATCCG CAAACGCACC CCGATGATAT TGTTTTTACG 
GCAGATGTTA TCGATCAGGC GACGCTTGAA CGCGTCAGTG AATTGCAAAT TCCGGTGAAT 
GCGGGTTCTG TTGATATGCT CGACCAACTG GGCCAGGTTT CGCCAGGGCA TCGGGTATGG 
CTGCGCGTTA ATCCGGGGTT TGGTCACGGA CATAGCCAAA AAACCAATAC CGGTGGCGAA 
AACAGCAAGC ACGGTATCTG GTACACCGAT CTGCCCGCCG CACTGGACGT GATACAACGT 
CATCATCTGC AGCTGGTCGG CATTCACATG CACATTGGTT CTGGCGTTGA TTATGCCCAT 
CTGGAACAGG TGTGTGGTGC TATGGTGCGT CAGGTCATCG AATTCGGTCA GGATTTACAG 
GCTATTTCTG CGGGCGGTGG GCTTTCTGTT CCTTATCAAC AGGGTGAAGA GGCGGTTGAT 
ACCGAACATT ATTATGGTCT GTGGAATGCC GCGCGTGAGC AAATCGCCCG CCATTTGGGC 
CACCCTGTGA AACTGGAAAT TGAACCGGGT CGCTTCCTGG TAGCGCAGTC TGGCGTATTA 
ATTACTCAGG TGCGGAGCGT CAAACAAATG GGGAGCCGCC ACTTTGTGCT GGTTGATGCC 
GGGTTCAACG ATCTGATGCG CCCGGCAATG TACGGTAGTT ACCACCATAT CAGTGCCCTG 
GCAGCTGATG GTCGTTCTCT GGAACACGCG CCAACGGTGG AAACCGTCGT CGCCGGACCG 
TTATGTGAAT CGGGCGATGT CTTTACCCAG CAGGAAGGGG GAAATGTTGA AACCCGCGCC 
TTGCCGGAAG TGAAGGCAGG TGATTATCTG GTACTGCATG ATACAGGGGC ATATGGCGCA 
TCAATGTCAT CCAACTACAA TAGCCGTCCG CTGTTACCAG AAGTTCTGTT TGATAATGGT 
CAGGCGCGGT TGATTCGCCG TCGCCAGACC ATCGAAGAAT TACTGGCGCT GGAATTGCTT 
TAA

Protein sequence

MPHSLFSTDT DLTAENLLRL PAEFGCPVWV YDAQIIRRQI AALKQFDVVR FAQKACSNIH 
ILRLMREQGV KVDSVSLGEI ERALAAGYNP QTHPDDIVFT ADVIDQATLE RVSELQIPVN 
AGSVDMLDQL GQVSPGHRVW LRVNPGFGHG HSQKTNTGGE NSKHGIWYTD LPAALDVIQR 
HHLQLVGIHM HIGSGVDYAH LEQVCGAMVR QVIEFGQDLQ AISAGGGLSV PYQQGEEAVD 
TEHYYGLWNA AREQIARHLG HPVKLEIEPG RFLVAQSGVL ITQVRSVKQM GSRHFVLVDA 
GFNDLMRPAM YGSYHHISAL AADGRSLEHA PTVETVVAGP LCESGDVFTQ QEGGNVETRA 
LPEVKAGDYL VLHDTGAYGA SMSSNYNSRP LLPEVLFDNG QARLIRRRQT IEELLALELL