Gene YPK_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_2001
Symbol
ID	6087684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	+
Start bp	2225377
End bp	2226879
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	50%
IMG OID	641597068
Product	L-arabinose isomerase
Protein accession	YP_001720741
Protein GI	170024236
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2160] L-arabinose isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGTAT TCAAGCAATC AGAAGTGTGG TTTGTCATTG GTAGCCAGAA TCTGTATGGC 
CCTAAAACCC TGCAACAAGT TATGGATAAT GCACATCAGG TGGTCAATAG CCTGAACAGC 
GAAGCGGGTT TACCCGTAAA ACTGGTATTA AAACCGTTGG TTACAACACC GGATGAAATC 
ACCGCATTAT GTCGTGAAGC TAACTACGAC ACGGCCTGTA TCGGTATCAT GACCTGGCTG 
CACACCTTCT CTCCGGCCAA AATGTGGATT GGCGGCCTGA GCATTCTGAA TAAACCGCTG 
TTACAGTTCC ATACCCAGTT TAATGCCCAA ATCCCGTGGG AAACGATGGA TATGGACTTT 
ATGAACCTAA ACCAGACCGC ACACGGTGGC CGTGAATTTG GTTTCATTGG TGCCCGCATG 
CGCCAGCAAC ACAGTGTGAT AACCGGTCAC TGGCAGGATA AAGAAGCCCA CCAGCGCATT 
GGTCAGTGGA TGCGCGTCGC CGCCGCAAAA CAAGAAAGTC AACAACTGAA AGTGGCGCGC 
TTTGGCGATA ACATGCGTGA AGTCGCCGTA ACTGAAGGGG ATAAAGTCGC TGCCCAGATC 
CAATTTGGCT ATTCCGTTAA TGCTTATGGC ATTGGGGATT TAGTCGCCGT GGTCGATGCC 
GTCAGTAAAG GTGATATCGA TACGCTGGTT GAAGAATATG AGGCCACCTA TCGCTTTAGC 
GATGCGGTGA AACTCAATGG TGATAAGCGC GAAAACTTAC TGGATGCAGC ACGTATTGAG 
CTAGGTATGA AGCGTTTTCT GGAGCAAGGT GGTTTTAAAG CCTTCACCAC TAACTTTGAA 
AATCTTTATG GTTTGAAGCA GTTACCTGGC CTGGCAGTCC AGCGACTCAT GCAACAGGGT 
TACGGTTTTG GTGGCGAAGG CGACTGGAAA ACCGCCGCAT TACTGCGCAT CTTAAAAGTG 
ATGGGAACCG GCCTGAAAGG CGGCACTTCC TTTATGGAGG ATTACACTTA TAACTTCCAG 
CCAGGTAATG ACTTAGTTGT TGGCTCACAT ATGCTGGAAG TCTGCCCGTC GATCGCCAAA 
GAAGAGAAGC CCCTGCTGGA TGTGCAACAC CTTGGCATTG GAGGGAAAGC TGACCCTGCC 
CGTTTGATTT TCTCTACCCC CGCAGGCCCG GCGCTGAATG CCAGTTTGAT CGATATGGGG 
AACCGTTTCC GCTTGCTGGT TAATGTGGTT GATACCGTTG AACAACCTCA TCCATTGCCA 
AAATTACCGG TTGCCCGGGC TATCTGGCAA GCACAACCTT CACTGGCAAC GGCTGCTGAA 
GCTTGGATCA TCGCCGGTGG CGCACACCAT ACGGTATTCT CACAAGCGGT GGGTGTCGAT 
GAACTGCGTT TATATGCCGA AATGCACGGT ATTGAATTCT TGTTGATCGA CAATGACACG 
ACGTTACCGG CGTTCAAAAA CGAAATCCGT TGGAACGAGG TGTACTATCA GCTCAATCGC 
TAA

Protein sequence

MDVFKQSEVW FVIGSQNLYG PKTLQQVMDN AHQVVNSLNS EAGLPVKLVL KPLVTTPDEI 
TALCREANYD TACIGIMTWL HTFSPAKMWI GGLSILNKPL LQFHTQFNAQ IPWETMDMDF 
MNLNQTAHGG REFGFIGARM RQQHSVITGH WQDKEAHQRI GQWMRVAAAK QESQQLKVAR 
FGDNMREVAV TEGDKVAAQI QFGYSVNAYG IGDLVAVVDA VSKGDIDTLV EEYEATYRFS 
DAVKLNGDKR ENLLDAARIE LGMKRFLEQG GFKAFTTNFE NLYGLKQLPG LAVQRLMQQG 
YGFGGEGDWK TAALLRILKV MGTGLKGGTS FMEDYTYNFQ PGNDLVVGSH MLEVCPSIAK 
EEKPLLDVQH LGIGGKADPA RLIFSTPAGP ALNASLIDMG NRFRLLVNVV DTVEQPHPLP 
KLPVARAIWQ AQPSLATAAE AWIIAGGAHH TVFSQAVGVD ELRLYAEMHG IEFLLIDNDT 
TLPAFKNEIR WNEVYYQLNR