Gene YPK_4057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_4057
Symbol
ID	6090485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	-
Start bp	4475754
End bp	4477604
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	53%
IMG OID	641599154
Product	dihydroxy-acid dehydratase
Protein accession	YP_001722772
Protein GI	170026267
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTAAGT ACCGTTCCCA TACCACCACC CATGGCCGCA ATATGGCCGG CGCCCGCGCA 
CTGTGGCGCG CAACCGGTAT GACCGATGAT GACTTCGGCA AACCGATTAT TGCAGTCGTT 
AACTCCTTTA CCCAATTTGT ACCGGGCCAC GTACATTTGC GCGATTTAGG CAAGCTGGTT 
GCGGAGCAAA TTGTAGCTTC TGGCGGTGTG GCTAAAGAGT TCAACACCAT TGCGGTGGAT 
GATGGTATCG CGATGGGCCA CGGTGGCATG CTCTACTCTC TGCCATCGCG TGAATTGATC 
GCCGACTCCG TTGAGTACAT GGTTAACGCC CACTGTGCGG ATGCCATGGT GTGTATCTCT 
AACTGTGACA AAATTACCCC AGGGATGCTG ATGGCGTCTC TGCGCCTGAA TATTCCGGTG 
ATCTTTGTGT CTGGTGGCCC GATGGAAGCC GGTAAGACCA AGCTGTCAGA TAAAATCATC 
AAGCTGGATT TGATCGATGC CATGATTCAG GGTGCGAATC CTAATGTGAG CGATGAAGAG 
AGCGCCCAGA TTGAGCGTTC TGCTTGCCCG ACCTGTGGTT CTTGCTCCGG TATGTTTACG 
GCTAACTCGA TGAACTGCCT GAATGAAGCG CTGGGTCTGG CGTTGCCGGG TAATGGTTCA 
TTGTTGGCAA CCCACGCTGA CCGTAAGCAA CTGTTCTTGG ATGCGGGTAA ACACATTGTT 
GCCTTGACCA AACGTTATTA TGAACAAGAT GACGTCAGCG CCTTGCCACG CAACATCGCG 
AATAAAGCGG CCTTTGAAAA CGCCATGATA TTGGATATCG CCATGGGCGG TTCCACGAAT 
ACCGTATTGC ATTTGCTGGC GGCGGCGCAG GAAGGTGAAA TTGATTTCAG CATGACCGAT 
ATCGATCACC TGTCCCGTAA AGTCCCACAT TTGTGCAAAG TGGCCCCGAG TACTCAGAAA 
TACCACATGG AAGATGTGCA CCGTGCGGGG GGGGTCATTG GTATTTTAGG TGAGTTGGAT 
CGCGCTGGTT TGCTTAACCG CGATGTCAGT AACGTGTTGG GGCTGAATCT GACACAAACG 
CTGGAAGCCT ATGACGTGAT GCTGACTCAG GATGAAGGCG TGAAGCAGAT GTACGCCGCA 
GGCCCAGCCG GTATTCGCAC CACTAAAGCG TTCTCACAGG ATTGCCGTTA TCCGTCACTG 
GATACCGATC GCGAAGAGGG TTGTATCCGT ACCCGTGAAC ATGCCTACAG CCAGGATGGT 
GGTTTAGCGG TGTTGTACGG CAATATTGCG GCAGACGGCT GTATTGTTAA AACTGCGGGT 
GTTGATAAAG ACAGCCTGAC GTTCCGTGGC CCGGCGAAAG TATTTGAGAG CCAGGATGAG 
GCGGTAGAGG CGATCCTCGG TGGTAAAGTT GTGGCGGGTG ATGTGGTTGT TATCCGTTAT 
GAAGGGCCAA AAGGGGGGCC GGGTATGCAG GAAATGCTCT ATCCGACCAC TTATCTGAAA 
TCCATGGGGT TGGGCAAGAG TTGTGCCTTA CTGACCGATG GCCGTTTCTC TGGCGGGACA 
TCCGGTTTGT CTATCGGCCA TGTGTCTCCA GAAGCCGCCA GTGGTGGGTT GATTGGTTTG 
GTACAAGATG GCGATTTCAT CAATATCGAT ATTCCGAACC GTGGCATTGT CTTGGATGTT 
AGCGAAGCTG AACTGGCTGC TCGCCGTGAA ACTGAAGAAG CGCATGGTGA TGCGGCCTGG 
TCACCGAAGG GCCGTGAGCG CCAGGTCTCT TATGCCTTAC GCGCTTACGC GATGTTAGCA 
ACCAGCGCTG ATAAAGGCGC GGTGCGCGAT AAAAGTAAGC TGGGAGGCTA A

Protein sequence

MPKYRSHTTT HGRNMAGARA LWRATGMTDD DFGKPIIAVV NSFTQFVPGH VHLRDLGKLV 
AEQIVASGGV AKEFNTIAVD DGIAMGHGGM LYSLPSRELI ADSVEYMVNA HCADAMVCIS 
NCDKITPGML MASLRLNIPV IFVSGGPMEA GKTKLSDKII KLDLIDAMIQ GANPNVSDEE 
SAQIERSACP TCGSCSGMFT ANSMNCLNEA LGLALPGNGS LLATHADRKQ LFLDAGKHIV 
ALTKRYYEQD DVSALPRNIA NKAAFENAMI LDIAMGGSTN TVLHLLAAAQ EGEIDFSMTD 
IDHLSRKVPH LCKVAPSTQK YHMEDVHRAG GVIGILGELD RAGLLNRDVS NVLGLNLTQT 
LEAYDVMLTQ DEGVKQMYAA GPAGIRTTKA FSQDCRYPSL DTDREEGCIR TREHAYSQDG 
GLAVLYGNIA ADGCIVKTAG VDKDSLTFRG PAKVFESQDE AVEAILGGKV VAGDVVVIRY 
EGPKGGPGMQ EMLYPTTYLK SMGLGKSCAL LTDGRFSGGT SGLSIGHVSP EAASGGLIGL 
VQDGDFINID IPNRGIVLDV SEAELAARRE TEEAHGDAAW SPKGRERQVS YALRAYAMLA 
TSADKGAVRD KSKLGG