Gene SeHA_C1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1103
Symbol	dpaL
ID	6491329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	1098227
End bp	1099441
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	46%
IMG OID	642741345
Product	diaminopropionate ammonia-lyase
Protein accession	YP_002044997
Protein GI	194447657
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family [TIGR03528] diaminopropionate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	0.624522
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGAGC TTATTAAATA TCAGTTTAAT ACACGTCGGA AAAAATATGG TACAGGAGCG 
GCCTTAAGTT TGCTTAACGG AAATGTTGGG CATGAGGTGT TAGCATTTCA TAAAAAATTA 
CCCAATTATG CCGTCACGCC GTTACATAAT CTGGCGCATC TAAGCCAGCG GCTTGGACTA 
GGGTCCATCC ATATTAAAGA TGAGTCCTGG CGTTTTGGCC TGAATGCTTT TAAAGGTCTG 
GGCGGCTCTT ATGCTGTAGG AAAATATCTC GCTGATAAAT TGCAATGTGA TATTAACTCG 
TTAAGTTTTG CTGCCCTTAA TACTCCTGAG ATTAAAGAAA AAATTAAAGA TTGTGTTTTT 
GTTACCGCGA CGGATGGCAA TCATGGCCGT GGTGTGGCGT GGGCGGCAGA GCAATTAGGT 
CTAAAAGCCG TCGTTTATAT GCCTAAAGGA TCATCGTTAA TCCGGGCAGA GAATATTCGC 
CATCATGGAG CTGAATGCAC CATCACCGAT CTGAACTACG ATGATGCAGT GCGACTGGCC 
CATAGAATGG CGCAAACAAA AGGCTGGGTG CTTTTGCAGG ATACAGCCTG GACAGGGTAT 
GAAGAGATCC CAACATGGAT TATGCAAGGC TATATGACAC TAGCGGTTGA AGCTTATGAG 
CAGCTCGCAG AAACAAACAG TCCGTTGCCA ACCCATCTTA TTTTACAAGC GGGGGTGGGA 
TCGTTTGCTG GCAGTGTTAT GGGTTATTTT GTTGAAAAAA TGCAGGAAAA TATCCCTAAT 
ATTATTGTGG TTGAGCCGCA TCAGGCCAAC TGTCTTTATC AATCCGCAGT TATGGATGAT 
GGTCAACCTC ACTGCGTCAC TGGCGATATG GCGACGATAA TGGCCGGGCT TGCGTGTGGG 
GAGCCGAATA TTATCAGTTG GCCTATTATT CGGGACAACA CCAGTTGTTT TATTTCCGCT 
GATGACTGTC TGGCGGCTAA GGGTATGCGT ATTTCTGCCG CGCCGCGTCC AGGTACGGAT 
ACGCCTTTTA TTTCCGGCGA GTCCGGAGCT ATTGGCGTAG GGTTACTTTA TGAGTTGATG 
AACAATATGC ATTATCAGGA TCTTGCTAAT CGCTTACAGC TTGATGCCAG TGCTCATGTT 
CTGCTTATTA GCACCGAAGG CGATACGTCC CCAGATATTT ATGAAGATAT AGTCTGGAAC 
GGACGCAGTG CTTAA

Protein sequence

MHELIKYQFN TRRKKYGTGA ALSLLNGNVG HEVLAFHKKL PNYAVTPLHN LAHLSQRLGL 
GSIHIKDESW RFGLNAFKGL GGSYAVGKYL ADKLQCDINS LSFAALNTPE IKEKIKDCVF 
VTATDGNHGR GVAWAAEQLG LKAVVYMPKG SSLIRAENIR HHGAECTITD LNYDDAVRLA 
HRMAQTKGWV LLQDTAWTGY EEIPTWIMQG YMTLAVEAYE QLAETNSPLP THLILQAGVG 
SFAGSVMGYF VEKMQENIPN IIVVEPHQAN CLYQSAVMDD GQPHCVTGDM ATIMAGLACG 
EPNIISWPII RDNTSCFISA DDCLAAKGMR ISAAPRPGTD TPFISGESGA IGVGLLYELM 
NNMHYQDLAN RLQLDASAHV LLISTEGDTS PDIYEDIVWN GRSA