Gene SeD_A1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1001
Symbol	ltaE
ID	6872584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	990477
End bp	991478
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	60%
IMG OID	642784186
Product	L-threonine aldolase
Protein accession	YP_002214861
Protein GI	198243778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.13566
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	101
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATT TACGCAGTGA TACCGTTACC CGACCGGGTC GCGCCATGCT CGAGGCGATG 
ATGACCGCCC CGATCGGGGA CGACGTATAC GGCGATGACC CTACTGTTAA CGCCCTTCAG 
CGCTACGCCG CCGACCTTTC CGGTAAAGAA GCGGCGCTTT TTTTACCCAC CGGCACCCAG 
GCCAATCTGG TCGCGCTGCT TAGCCATTGT GAACGCGGCG AAGAGTATAT CGTCGGTCAG 
GGCGCGCATA ATTATCTCTA TGAAGCTGGC GGCGCGGCGG TGCTCGGCAG CATTCAGCCG 
CAGCCCATCG ACGCCGCCGC GGACGGTACG CTGCCGCTGG AGAACGTGGC GGCGAAGATT 
AAAGCGGATG ACATCCACTT CGCGCGTACG CGCTTGCTCA GTCTGGAAAA TACGCATAAC 
GGGAAAGTGC TGCCGCGCGC GTATCTGAAA GACGCCTGGA CGTTTACCCG CGAACGTGGG 
CTGGCGCTGC ACGTTGACGG CGCCCGAATT TTTAACGCGG TGGTTGCCTA CGGCTGTGAG 
TTAAAAGAGA TTACGCAGTA TTGCGACTCT TTTACCATCT GCCTGTCAAA AGGTCTCGGA 
ACGCCGGTCG GTTCGCTGCT GGTCGGTAAC CGCGACTACA TTAAACGCGC GACACGCTGG 
CGTAAAATGG TCGGCGGCGG AATGCGTCAG GCCGGGATTC TGGCAGCGGC CGGACTGTAT 
GCGCTGAAGC ATAACGTGGC GCGTCTGCAA GAGGATCATG ATAACGCCGC CTGGCTGGCG 
CAGCAGCTTC GCGAAGCGGG CGCGGAGGTC ATGCGCCACG AAACGAATAT GCTGTTTGTT 
CGCGTTGGCG AAGCACAGGC CGCCGCGCTT GGCGACTATT TGCGGGAACG GAATATCCTG 
ATTAACGCCG CGCCGATTGT GCGTCTGGTG ACGCATCTGG ATGTCTCTCG CGAACAGCTT 
ACCGACGTCG TCGCCCACTG GCGCGCCTTT TTAGCCCGCT AA

Protein sequence

MIDLRSDTVT RPGRAMLEAM MTAPIGDDVY GDDPTVNALQ RYAADLSGKE AALFLPTGTQ 
ANLVALLSHC ERGEEYIVGQ GAHNYLYEAG GAAVLGSIQP QPIDAAADGT LPLENVAAKI 
KADDIHFART RLLSLENTHN GKVLPRAYLK DAWTFTRERG LALHVDGARI FNAVVAYGCE 
LKEITQYCDS FTICLSKGLG TPVGSLLVGN RDYIKRATRW RKMVGGGMRQ AGILAAAGLY 
ALKHNVARLQ EDHDNAAWLA QQLREAGAEV MRHETNMLFV RVGEAQAAAL GDYLRERNIL 
INAAPIVRLV THLDVSREQL TDVVAHWRAF LAR