Gene B21_02647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02647
Symbol	lysA
ID	8115497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2815127
End bp	2816389
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	53%
IMG OID	644848844
Product	hypothetical protein
Protein accession	YP_003000417
Protein GI	251786113
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACATT CACTGTTCAG CACCGATACC GATCTCACCG CCGAAAATCT GCTGCGTTTG 
CCCGCTGAAT TTGGCTGCCC GGTGTGGGTC TACGATGCGC AAATTATTCG TCGGCAGATT 
GCAGCGCTGA AACAGTTTGA TGTGGTGCGC TTTGCACAGA AAGCCTGTTC CAATATTCAT 
ATTTTGCGCT TAATGCGTGA GCAGGGCGTG AAAGTGGATT CCGTCTCGTT AGGCGAAATA 
GAGCGTGCGT TGGCGGCGGG TTACAATCCG CAAACGCACC CCGATGATAT TGTTTTTACG 
GCAGATGTTA TCGATCAGGC GACGCTTGAA CGCGTCAGTG AATTGCAAAT TCCGGTGAAT 
GCGGGTTCTG TTGATATGCT CGACCAACTG GGCCAGGTTT CGCCAGGGCA TCGGGTATGG 
CTGCGCGTTA ATCCGGGGTT TGGTCACGGA CATAGCCAAA AAACCAATAC CGGTGGCGAA 
AACAGCAAGC ACGGTATCTG GTACACCGAT CTGCCCGCCG CACTGGACGT GATACAACGT 
CATCATCTGC AGCTGGTCGG CATTCACATG CACATTGGTT CTGGCGTTGA TTATGCCCAT 
CTGGAACAGG TGTGTGGTGC TATGGTGCGT CAGGTCATCG AATTCGGTCA GGATTTACAG 
GCTATTTCTG CGGGCGGTGG GCTTTCTGTT CCTTATCAAC AGGGTGAAGA GGCGGTTGAT 
ACCGAACATT ATTATGGTCT GTGGAATGCC GCGCGTGAGC AAATCGCCCG CCATTTGGGC 
CACCCTGTGA AACTGGAAAT TGAACCGGGT CGCTTCCTGG TAGCGCAGTC TGGCGTATTA 
ATTACTCAGG TGCGGAGCGT CAAACAAATG GGGAGCCGCC ACTTTGTGCT GGTTGATGCC 
GGGTTCAACG ATCTGATGCG CCCGGCAATG TACGGTAGTT ACCACCATAT CAGTGCCCTG 
GCAGCTGATG GTCGTTCTCT GGAACACGCG CCAACGGTGG AAACCGTCGT CGCCGGACCG 
TTATGTGAAT CGGGCGATGT CTTTACCCAG CAGGAAGGGG GAAATGTTGA AACCCGCGCC 
TTGCCGGAAG TGAAGGCAGG TGATTATCTG GTACTGCATG ATACAGGGGC ATATGGCGCA 
TCAATGTCAT CCAACTACAA TAGCCGTCCG CTGTTACCAG AAGTTCTGTT TGATAATGGT 
CAGGCGCGGT TGATTCGCCG TCGCCAGACC ATCGAAGAAT TACTGGCGCT GGAATTGCTT 
TAA

Protein sequence

MPHSLFSTDT DLTAENLLRL PAEFGCPVWV YDAQIIRRQI AALKQFDVVR FAQKACSNIH 
ILRLMREQGV KVDSVSLGEI ERALAAGYNP QTHPDDIVFT ADVIDQATLE RVSELQIPVN 
AGSVDMLDQL GQVSPGHRVW LRVNPGFGHG HSQKTNTGGE NSKHGIWYTD LPAALDVIQR 
HHLQLVGIHM HIGSGVDYAH LEQVCGAMVR QVIEFGQDLQ AISAGGGLSV PYQQGEEAVD 
TEHYYGLWNA AREQIARHLG HPVKLEIEPG RFLVAQSGVL ITQVRSVKQM GSRHFVLVDA 
GFNDLMRPAM YGSYHHISAL AADGRSLEHA PTVETVVAGP LCESGDVFTQ QEGGNVETRA 
LPEVKAGDYL VLHDTGAYGA SMSSNYNSRP LLPEVLFDNG QARLIRRRQT IEELLALELL