Gene SeSA_A2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A2039
Symbol	edd
ID	6515946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	1956184
End bp	1957995
Gene Length	1812 bp
Protein Length	603 aa
Translation table	11
GC content	56%
IMG OID	642747119
Product	phosphogluconate dehydratase
Protein accession	YP_002114920
Protein GI	194734911
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR01196] 6-phosphogluconate dehydratase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCTA ATTTGTTACG CGTAACACAG CGCATTGTCG AACGCTCGCA GCAGACCCGA 
AAAGCCTATC TTGCCCGCAT TGAGCAGGCG AAAACCGCCA CGGTCCACCG ATCTCAACTG 
GCCTGCGGCA ACCTGGCGCA TGGCTTCGCC GCCTGTCAGC CAGAGGACAA AGCCTCGCTG 
AAAAGTATGT TGCGCAATAA TATCGCCATC ATTACCTCCT ACAATGACAT GCTCTCTGCG 
CATCAACCGT ATGAACATTA TCCGGAAATT ATTCGTCAGG CCCTGCATTC CGTGAATGCG 
GTAGGTCAGG TCGCAGGCGG CGTACCGGCA ATGTGCGATG GCGTTACGCA AGGGCAGGAT 
GGCATGGAGT TGTCATTACT CAGCCGCGAA GTGATAGCGA TGTCGGCAGC AGTAGGCCTC 
TCTCACAATA TGTTTGACGG CGCGTTATTC CTCGGCGTAT GCGACAAAAT CGTTCCGGGG 
CTGGCGATGG CCGCGCTCTC TTTTGGTCAT TTACCCGCGA TTTTTGTTCC GTCAGGCCCG 
ATGGCGAGCG GCCTGCCGAA TAAAGAAAAA GTCCGTATTC GTCAGCTATA TGCGGAAGGA 
AAAGTAGACA GAATGGCGCT GCTGGAGTCA GAGGCCGCCT CTTACCATGC GCCGGGCACC 
TGTACATTTT ACGGCACCGC CAACACCAAC CAGATGGTGG TGGAGTTTAT GGGAATGCAG 
TTGCCGGGTT CCTCGTTTGT GCATCCGGAT GCGCCGCTGC GCGAGGCATT GACTGCCGCT 
GCCGCACGTC AGGTAACACG TCTTACCGGC AACGGCAATA CGTGGATGCC GCTCGGTAAA 
ATGATCGACG AAAAAGTTGT GGTGAACGGC ATTGTCGCGC TGCTGGCTAC CGGCGGCTCC 
ACCAACCACA CCATGCATCT GGTTGCAATG GCGCGCGCGG CGGGCATTCT GATCAACTGG 
GATGACTTCT CGGATTTGTC GGAAGTGGTT CCGTTGATGG CGCGTCTGTA CCCGAACGGT 
CCGGCGGACA TTAACCACTT CCAGGCGGCG GGCGGCGTAC CGGTATTGAT GCGTGAGCTG 
CTCAATGCCG GATTGTTGCA CGAAGACGTT AACACTGTCG CAGGCTTCGG CCTGAAACGC 
TATACGCTGG AGCCCTGGCT CAACAACGGC GAGCTGGACT GGCGTGAAGG CGCGGAAAGG 
TCACTGGATA ACGATGTCAT TGCCTCTTTT GATAAGCCGT TCTCTCCTCA CGGCGGTACT 
AAGGTGCTAA GCGGTAATCT GGGGCGCGCA GTAATGAAGA CGTCTGCGGT ACCGGTTGAA 
AACCAGATCA TTGAAGCGCC TGCCATGGTA TTTGAAAGTC AGCATGATGT GCTGCCTGCG 
TTTGACGCGG GCCTGCTTGA CCGGGATTGT GTCGTTGTCG TGCGTCATCA GGGACCAAAA 
GCGAATGGAA TGCCAGAATT ACATAAACTC ATGCCGCCAC TTGGTGTATT ATTGGACCGC 
CGTTTCAAAA TCGCGTTAGT TACTGATGGA CGACTTTCAG GCGCTTCGGG TAAAGTGCCT 
TCAGCTATCC ACGTAACGCC GGAAGCCTAC GATGGCGGCT TACTGGCAAA AGTGCGCGAT 
GGCGACATCA TTCGCGTGAA TGGGCAGACA GGTGAGTTAA CTCTGCTGGT CGACGAGGCG 
GAACTTGCCG CTCGTCAGCC TCATATTCCG GACCTGAGCG CGTCGCGCGT CGGAACGGGG 
CGTGAGTTGT TTGGCGCGCT GCGCGAAAAG CTGTCGGGTG CGGAGCAGGG CGCAACCTGT 
ATCACTTTTT AA

Protein sequence

MNPNLLRVTQ RIVERSQQTR KAYLARIEQA KTATVHRSQL ACGNLAHGFA ACQPEDKASL 
KSMLRNNIAI ITSYNDMLSA HQPYEHYPEI IRQALHSVNA VGQVAGGVPA MCDGVTQGQD 
GMELSLLSRE VIAMSAAVGL SHNMFDGALF LGVCDKIVPG LAMAALSFGH LPAIFVPSGP 
MASGLPNKEK VRIRQLYAEG KVDRMALLES EAASYHAPGT CTFYGTANTN QMVVEFMGMQ 
LPGSSFVHPD APLREALTAA AARQVTRLTG NGNTWMPLGK MIDEKVVVNG IVALLATGGS 
TNHTMHLVAM ARAAGILINW DDFSDLSEVV PLMARLYPNG PADINHFQAA GGVPVLMREL 
LNAGLLHEDV NTVAGFGLKR YTLEPWLNNG ELDWREGAER SLDNDVIASF DKPFSPHGGT 
KVLSGNLGRA VMKTSAVPVE NQIIEAPAMV FESQHDVLPA FDAGLLDRDC VVVVRHQGPK 
ANGMPELHKL MPPLGVLLDR RFKIALVTDG RLSGASGKVP SAIHVTPEAY DGGLLAKVRD 
GDIIRVNGQT GELTLLVDEA ELAARQPHIP DLSASRVGTG RELFGALREK LSGAEQGATC 
ITF