Gene SeD_A1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1070
Symbol
ID	6871887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1073816
End bp	1075030
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	46%
IMG OID	642784255
Product	diaminopropionate ammonia-lyase
Protein accession	YP_002214929
Protein GI	198242145
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family [TIGR03528] diaminopropionate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0000973165
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCATGAGC TTATTAAATA CCAGTTTAAT ACACGTCGGA AAAAATATGG TACAGGAGCG 
GCTTTAAGTT TGCTTAACGG AAATGTTGGG CGTGAGGTGT TAGCATTTCA TAAAAAATTA 
CCCAATTATG CCGTTACGCC GTTACATAAT CTGGCGCATC TAAGCCGGCG GCTTGGACTA 
GGGTCCATCC ATATTAAAGA TGAGTCCTGG CGTTTTGGTC TGAATGCTTT TAAAGGTCTG 
GGCGGCTCTT ATGCTGTAGG AAAATATCTC GCTGATAAAT TGCAATGTGA TATTAACTCG 
TTAAGTTTTG CTGCCCTTAA CACTCCTGAG ATTAAAGAAA AAATTAAGGA TTGTGTTTTT 
GTTACCGCGA CGGATGGCAA TCATGGCCGT GGTGTGGCGT GGGCGGCGGA GCAATTAGGT 
CTAAAAGCCG TCGTTTATAT GCCTAAAGGA TCATCGTTAA TCCGGGCAGA GAATATTCGC 
CATCATGGAG CTGAATGCAC CATCACCGAT CTGAACTACG ATGATGCAGT GCGACTGGCC 
CATAGAATGG CGCAAACAAA AGGCTGGGTG CTTTTGCAGG ATACAGCCTG GACAGGGTAT 
GAAGAGATCC CAACGTGGAT TATGCAAGGC TATATGACAC TAGCGGTTGA AGCTTATGAT 
CAGCTCGCAG AAACAAACAG TCCGTTGCCA ACCCACCTTA TTTTACAAGC GGGGGTGGGA 
TCATTTGCTG GCAGTGTTAT GGGTTATTTT GTTGAAAAAA TGCAGGAAAG TATCCCTAAT 
ATTATTGTGG TTGAGCCGCA TCAGGCCAAC TGTCTTTATC AATCCGCAGT TATGAATGAT 
GGTCAACCTC ACTGCGTCAC TGGCGATATG GCGACGATAA TGGCCGGGCT TGCGTGTGGG 
GAGCCGAATA TTATCAGTTG GCCTATTATT CGGGACAACA CCAGTTGTTT TATTTCCGCT 
GATGATTGTC TGGCGGCTAA GGGTATGCGC ATTTCTGCCG CGCCGCGTCC AGGTACGGAT 
ACGCCTTTTA TTTCCGGCGA GTCCGGAGCT ATTGGCGTAG GGTTACTTTA TGAGTTGATG 
AACAATATGC ATTATCAGGA TCTTGCTAAT CGCTTACAGC TTGATGCCAA TGCTCATGTT 
CTGCTTATTA GCACCGAAGG CGATACGTCC CCAGATATTT ATGAAGATAT AGTCTGGAAC 
GGACGCAGTG CTTAA

Protein sequence

MHELIKYQFN TRRKKYGTGA ALSLLNGNVG REVLAFHKKL PNYAVTPLHN LAHLSRRLGL 
GSIHIKDESW RFGLNAFKGL GGSYAVGKYL ADKLQCDINS LSFAALNTPE IKEKIKDCVF 
VTATDGNHGR GVAWAAEQLG LKAVVYMPKG SSLIRAENIR HHGAECTITD LNYDDAVRLA 
HRMAQTKGWV LLQDTAWTGY EEIPTWIMQG YMTLAVEAYD QLAETNSPLP THLILQAGVG 
SFAGSVMGYF VEKMQESIPN IIVVEPHQAN CLYQSAVMND GQPHCVTGDM ATIMAGLACG 
EPNIISWPII RDNTSCFISA DDCLAAKGMR ISAAPRPGTD TPFISGESGA IGVGLLYELM 
NNMHYQDLAN RLQLDANAHV LLISTEGDTS PDIYEDIVWN GRSA