Gene YPK_0347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_0347
Symbol
ID	6090852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	-
Start bp	371987
End bp	374032
Gene Length	2046 bp
Protein Length	681 aa
Translation table	11
GC content	52%
IMG OID	641595412
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_001719110
Protein GI	170022605
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAATA ATACAACGTC ATTACCCGCT GAAAATTCGT CACACCCACG TAAAGGCACA 
CCTATTCGTA AAAAGCAGCG CGAAGAGGCC CAACAGTTTA TTAATACCTT ACAAGGCGTT 
ACTTTCCCCA ACTCCCAACG TATTTATCTA CAAGGCTCTC GGCCCGATAT TCAAGTGCCG 
ATGCGTGAAA TCCAACTCAG CCCGACGCAA ATCGGCGGCA GTAAAAACGA ACCACGCTAT 
GAAGATAATG AGGCCATCCC GGTCTATGAC ACCTCCGGTC CCTATGGTGA CCCACAAGCT 
AAACTGGATG TTCACAACGG GCTGCCTAAA CTGCGTGCCG CTTGGGTCGC TGATCGCCAA 
GATACTGAAG CGCTGGCATC TGTCAGTTCC GGCTTTACCC AACAGCGTTT GGCTGATGAA 
GGCCTGGACC ATTTACGTTT TGAGCATCTA CCCCGCCCAC GGAAAGCAGC CACTGGTCAA 
TGTGTGACTC AGTTGCATTA CGCCCGACAG GGGAAAATCA CGCCAGAGAT GGAGTTTATC 
GCCCTACGGG AAAATATGGG CCGTGAACGT ATTCGGGGTG AAGTCTTGCT TCAACAACAT 
CCGGGACAAG CGTTTGGTGC CCATCTGCCG GAAAATATCA CCGCCGAGTT TGTGCGTCAG 
GAAGTGGCGG CCGGCCGAGC CATCATCCCC GCCAATATTA ATCACCCAGA ATCTGAACCA 
ATGATTATTG GCCGTAATTT TCTGGTCAAA GTGAATGCCA ACATCGGTAA TTCCGCCGTG 
ACCTCTTCCA TTGAAGAAGA GGTAGAAAAA CTGGTCTGGT CTACCCGCTG GGGGGCCGAT 
ACGGTGATGG ACTTATCTAC GGGCCGCTAT ATTCATGAAA CGCGGGAATG GATCCTACGT 
AACAGCCCGG TCCCTATTGG CACGGTACCT ATCTATCAGG CGCTGGAAAA AGTTAATGGC 
GTGGCCGAAA ACCTGACCTG GGAAATGTTC CGTGACACCC TGTTAGAGCA GGCAGAGCAA 
GGGGTAGACT ATTTTACTCT CCACGCGGGG GTCTTGTTGC GCTATGTGCC GATGACTGCC 
AAACGCCTAA CCGGTATCGT CTCTCGCGGC GGTTCAATTA TGGCAAAATG GTGCCTTTCG 
CATCATCAGG AAAACTTCCT GTATCAGCAT TTCCGCGAAA TCTGTCAGAT TTGTGCAGCC 
TATGACGTTT CATTATCACT GGGCGATGGC CTGCGCCCTG GCTCTATTCA AGATGCCAAT 
GATGAGGCCC AATTCGCCGA ACTGCATACC TTGGGTGAAT TGACCAAAAT CGCCTGGGAG 
TATGATGTAC AGGTGATGAT CGAAGGCCCA GGGCATGTGC CGATGCAGAT GATCCGCCGC 
AATATGACCG AGGAACTGGA ACACTGCCAC GAAGCGCCAT TTTATACCTT AGGCCCACTG 
ACCACGGACA TCGCACCGGG CTATGACCAC TTTACCTCAG GGATTGGTGC AGCGATGATC 
GGCTGGTTCG GTTGCTCCAT GCTCTGTTAT GTCACCCCCA AAGAGCACCT TGGTCTGCCG 
AATAAAGAGG ATGTCAAACA GGGGCTTATT ACTTACAAAA TTGCCGCGCA CGCCGCAGAT 
TTGGCTAAAG GCCACCCCGG TGCGCAAATT CGTGATAACG CCATGTCCAA AGCTCGCTTT 
GAGTTCCGCT GGGAAGATCA ATTCAATTTG GCGCTTGATC CAGCAACAGC CCGCGCTTAC 
CACGATGAAA CCTTGCCGCA AGAGTCCGGG AAAGTCGCTC ATTTTTGTTC CATGTGCGGC 
CCGAAATTCT GTTCAATGAA AATCTCACAA GAGGTCCGCG ATTATGCTGC GGCACAAGAA 
CAAGCGGCCG CACAAGCACA AGCCGCTACA CCAACCACCG CAGCACAACC AATAGACATC 
ACGCAGCCAA TTAATATGCT GCAATCAGGG ATGGAAAAAA TGTCGGCCGA GTTTCGCTCC 
CGTGGCAGTG AGCTATACCA CCGCCCGGCG AATCTGAGTG CGGAGGCCAA TAATGAGCCA 
ACTTGA

Protein sequence

MSNNTTSLPA ENSSHPRKGT PIRKKQREEA QQFINTLQGV TFPNSQRIYL QGSRPDIQVP 
MREIQLSPTQ IGGSKNEPRY EDNEAIPVYD TSGPYGDPQA KLDVHNGLPK LRAAWVADRQ 
DTEALASVSS GFTQQRLADE GLDHLRFEHL PRPRKAATGQ CVTQLHYARQ GKITPEMEFI 
ALRENMGRER IRGEVLLQQH PGQAFGAHLP ENITAEFVRQ EVAAGRAIIP ANINHPESEP 
MIIGRNFLVK VNANIGNSAV TSSIEEEVEK LVWSTRWGAD TVMDLSTGRY IHETREWILR 
NSPVPIGTVP IYQALEKVNG VAENLTWEMF RDTLLEQAEQ GVDYFTLHAG VLLRYVPMTA 
KRLTGIVSRG GSIMAKWCLS HHQENFLYQH FREICQICAA YDVSLSLGDG LRPGSIQDAN 
DEAQFAELHT LGELTKIAWE YDVQVMIEGP GHVPMQMIRR NMTEELEHCH EAPFYTLGPL 
TTDIAPGYDH FTSGIGAAMI GWFGCSMLCY VTPKEHLGLP NKEDVKQGLI TYKIAAHAAD 
LAKGHPGAQI RDNAMSKARF EFRWEDQFNL ALDPATARAY HDETLPQESG KVAHFCSMCG 
PKFCSMKISQ EVRDYAAAQE QAAAQAQAAT PTTAAQPIDI TQPINMLQSG MEKMSAEFRS 
RGSELYHRPA NLSAEANNEP T