Gene SeD_A2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2039
Symbol	astE
ID	6873986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1969406
End bp	1970374
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	58%
IMG OID	642785153
Product	succinylglutamate desuccinylase
Protein accession	YP_002215819
Protein GI	198242427
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2988] Succinylglutamate desuccinylase
TIGRFAM ID	[TIGR03242] succinylglutamate desuccinylase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.429087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAACT TTCTGGCGTT GACGCTAAGT GGCACGACAC CACGGGTGAC GCAGGGGAAG 
AGCGCGGGTT TTCGCTGGCG CTGGTTAGGT CATGGTCTGC TTGAACTCAC GCCCGATGCG 
CCGGTCGACC GCGCGTTAAT TCTTTCTGCG GGGATACACG GCAATGAAAC CGCGCCGGTA 
GAGATGCTGG ATAAGCTGCT GTCGGCGCTG TTTTCAGGCA GCTTGACGTT AACGTGGCGA 
GTGCTGGTGG TACTCGGCAA TCCGCAGGCG CTGGCGGCGG GAATACGCTA TTGTCACAGC 
GATATGAACC GTATGTTTGG CGGGCGTTGG CAGTCCTTTG CCGAAAGCGA TGAAACGCGG 
CGGGCGCGTG AGCTGGAGCT CAGTCTGGAG ACCTTCTTTT CATCTGGCCA TGCGCGGGTA 
CGCTGGCATC TGGATCTGCA TACCGCCATT CGTGGCTCGC ATCATTTGCG TTTTGGCGTA 
TTGCCGCAGC GCGACCGCCC GTGGGAGACA GATTTTCTGG CGTGGCTGGG CGCGGCAGGA 
CTAGAGGCGT TGGTATTTCA TCAGGCGCCC GGCGGTACGT TTACGCACTT TAGCTCTGAA 
CATTTCGGCG CGCTTTCCTG TGCGCTGGAG TTGGGAAAGG CGTTGCCGTT TAGGCAAAAC 
GATCTGACGC AGTTCAACGT AACCTCGCAG GCGTTGTCGG CGTTGCTGAG CGGTGTCGAA 
ACGTCAACCT CGTTTTCGCC GCCGCTACGC TATCGGGTGG TGTCGCAAAT CACGCGTCAC 
AGCGACAAGT TCGCGCTTTA TATGGATGCG CAAACGCTGA ATTTTACTGC CTTTGCGAAG 
GGAACGTTGC TGGCCGAGGA GGGGGATAAG CGCGTGACGG TGACGCATGA CGTTGAATAT 
GTTCTCTTTC CTAATCCCTC TGTCGCCTGC GGATTGCGGG CTGGATTAAT GCTGGAAAGA 
CTGCCCTGA

Protein sequence

MDNFLALTLS GTTPRVTQGK SAGFRWRWLG HGLLELTPDA PVDRALILSA GIHGNETAPV 
EMLDKLLSAL FSGSLTLTWR VLVVLGNPQA LAAGIRYCHS DMNRMFGGRW QSFAESDETR 
RARELELSLE TFFSSGHARV RWHLDLHTAI RGSHHLRFGV LPQRDRPWET DFLAWLGAAG 
LEALVFHQAP GGTFTHFSSE HFGALSCALE LGKALPFRQN DLTQFNVTSQ ALSALLSGVE 
TSTSFSPPLR YRVVSQITRH SDKFALYMDA QTLNFTAFAK GTLLAEEGDK RVTVTHDVEY 
VLFPNPSVAC GLRAGLMLER LP