Gene YPK_2045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_2045
Symbol
ID	6089010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	+
Start bp	2276500
End bp	2277927
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	51%
IMG OID	641597112
Product	bifunctional indole-3-glycerol phosphate synthase/phosphoribosylanthranilate isomerase
Protein accession	YP_001720785
Protein GI	170024280
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0134] Indole-3-glycerol phosphate synthase [COG0135] Phosphoribosylanthranilate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGAAA CTGGGGGTTA CAAAACCGAG GGTTATAACG TTGGCAGTGA CAAAGTTGAC 
AGTGATAAAA CCAAAACCGT GCTCCACCAA ATCGTACACG ATAAAGAAAT TTGGGTTGCC 
GCGCGGAAAC TGCAACAGCC TCTAACCCGC TTCCAAAACG AAATCACCCA GAGTCAGCGC 
GATTTTTATC ACGCGCTACA AGGCGATAAA ACGGTCTTTA TTTTGGAATG CAAAAAAGCC 
TCACCTTCTA AAGGGGTTAT CCGTGACAAC TTTAACCCGG CGGAGATTGC CGGTGTTTAT 
AAGCACTATG CGTCGGCTAT CTCAGTATTA ACGGATGAGA AATATTTCCA GGGCAGTTTT 
GATTTCTTGC CACAAGTCAG TGCCGCCGTC ACTCAGCCGG TATTGTGTAA AGATTTTATT 
ATTGATGCTT ATCAGATTCA GCTAGCGCGG TTTTACCACG CTGACGCCAT TTTACTGATG 
CTGTCGGTCT TGGACGATGA GGCTTACCGC CAATTGGCCG CCGTCGCACA CAGCCTGAAC 
ATGGGGGTGT TGACCGAAGC CAGTAACGCC GAAGAATTGG AGCGTGCTAT TACCTTGGGT 
GCCAAAGTTG TTGGCATCAA TAACCGCGAC CTGCGTGACC TGTCTATCGA TCTGAATCGC 
ACCCGTGAAT TGGCACCACG CCTACCAGAA GGTGTCACAA TAATCAGTGA ATCTGGCATT 
AGTCATTATC GTCAGGTCCG TGAATTGAGC CAATTTGCCA ACGGTTTCCT GATTGGCAGT 
GCCCTGATGT CCGAACCCGA TCTCAACGCG GCCGTCCGCC GGGTGTTACT GGGCGAAAAT 
AAAGTTTGCG GCCTGACACG CGCACAAGAT GCCGCCACGG CTTACCACGC AGGTGCGGTG 
TACGGCGGGT TGATTTTTGT CGACAGTTCA CCGCGGTATG TGGATATCGC CAGCGCCCGT 
ACGGTTATCA GTGGTGCGCC GCTAAAGTAT GTCGGTGTTT TTCGTCATGC TGAAATAGAA 
ACTGTACGGC AAACGGCTGA ACAACTCTCA CTGGCAGCAG TGCAATTGCA TGGGCATGAA 
GATCAACAGT ATATCAATCA ACTGCGCAAA GTATTACCTG CGGGTTGCCA GATTTGGAAG 
GCACTGAGTG TCGGTGACAC GATGCCGGAA CGCAACTTAC AGCAAGTTGA ACGCTACGTA 
CTGGATCACG GTACGGGTGG CACAGGGCAA CGTTTCGACT GGTCATTATT GGCAGATCAG 
GCACTGGATA ATGTCTTGCT GGCGGGCGGT TTGGGGCCAG AGAACTGTGA TGTGGCGGCC 
CAACTAGGCT GTGCGGGTCT GGATGTCAAT TCCGGCGTAG AAAGCGCCCC TGGCATCAAA 
GACCCCCAAC GGATCGCCGC TGTATTCCAG GCATTACGCG TGTACTGA

Protein sequence

MQETGGYKTE GYNVGSDKVD SDKTKTVLHQ IVHDKEIWVA ARKLQQPLTR FQNEITQSQR 
DFYHALQGDK TVFILECKKA SPSKGVIRDN FNPAEIAGVY KHYASAISVL TDEKYFQGSF 
DFLPQVSAAV TQPVLCKDFI IDAYQIQLAR FYHADAILLM LSVLDDEAYR QLAAVAHSLN 
MGVLTEASNA EELERAITLG AKVVGINNRD LRDLSIDLNR TRELAPRLPE GVTIISESGI 
SHYRQVRELS QFANGFLIGS ALMSEPDLNA AVRRVLLGEN KVCGLTRAQD AATAYHAGAV 
YGGLIFVDSS PRYVDIASAR TVISGAPLKY VGVFRHAEIE TVRQTAEQLS LAAVQLHGHE 
DQQYINQLRK VLPAGCQIWK ALSVGDTMPE RNLQQVERYV LDHGTGGTGQ RFDWSLLADQ 
ALDNVLLAGG LGPENCDVAA QLGCAGLDVN SGVESAPGIK DPQRIAAVFQ ALRVY