Gene YPK_3551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_3551
Symbol
ID	6089438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	-
Start bp	3909212
End bp	3910822
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	52%
IMG OID	641598635
Product	hypothetical protein
Protein accession	YP_001722271
Protein GI	170025766
COG category	[S] Function unknown
COG ID	[COG3455] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03349] type IV / VI secretion system protein, DotU family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.178777
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAT TTGAACGCCA GATCCGTGCA GCCATTTCCG CAGCACGCAA TGGCGCAAAA 
CATGCGGAAC AGTCACTGAC TACACCAATG TGGCAAGCCA AAAGCACCGT AGCCTCATTG 
GGTGGGATTG TCCCTAGAAG TGGCTCTTCG TCAACGTCAC AGGCGGAGAA CTATAAGGAA 
GGTCTCGCGG ACCAGGCTGC CTCGGGCAAC AACATGGCGC GCACGAGTGC GCCACCGGTC 
ACTTTGTATC AGCAACAGCC AAATGCGAAT GACAGCTATC CAAACGGGAA TAACAACAAT 
CCAAACGGGG ATAACAACAA TCCAAACGGG AGTAACAACA ATATAGCGAG AGTACAGCGT 
ATGCCGCATG GCATTTCCAG GGGCTTATAT GAGCGCCCTG GGATGTTATT GGGTGCCTGG 
GATAACGCCT ATATTGCTGC GGCTATGCCT TTGCTGCTGC TGGTGGAAAA TATTCGTAGC 
TGGCCGACGC GTAACGCCGC AGAGGTCAGG CCACCGATTG TGCGGGAATT ACAATATTTC 
CAGCAACATT TGCAGAAAAA GAACTACCCG CAAGAAGACA TTAACCACCT GTCTTACCTG 
CTATGTACCT ATATCGATGG CATTTTTAAC GGGCTGCAAA CCCCAGGCTC CTACAACCAA 
AGTCTGTTAG TGGAGTTTCA CCGTGATGCC TGGGGGGGTG AGGACTGCTT CGAACATCTG 
CGGGTCTATA TGAACTCGCC GAAACAGTAC CGGGAAGTTC TGGAATTCTA TGATCTGATT 
ATGTGCCTTG GTTTTGACGG TAAATACCAG ATGATAGAGC ATGGTGCGGT TCTGCTGATG 
GATTTACGCA GCCGTCTCCA CACGCAACTC TACGGTCAGG ACGCCACACA ATCTTTGGCT 
ATCGCGCAAG CGGTCAAAGG TTCTCCGCGT CGCCAATATA TCAAGGCGCT GAAAATCTTC 
ACCTATGGTT TCGCACTGTG CCTTTGTGCT TACGGCGTCA CGGCGTGGTA TCTGCACCAG 
CAATCCCAAC AGATCCGCAG CAACATTCTG ACGTGGGTAC TGCCTGAACC GCGGAAAATC 
AACATCATGG AGACCTTGCC GAATCCGCTA TCCAACATCC TGAATGAAGG GTGGCTGGAG 
GTCAGGAAAG ATCCGCGTGG ATGGCTATTA ATCTTCACCT CCGACGGCGC GTTCCGCACG 
GGTGAAGCGA CCCTCTCGGA AGAGTTTATC AACAAGAAGA ATATCGAACG TCTTGGGCTG 
GCATTAGCCC CATGGCCGGG AGATATCGAG GTTATTGGTC ATACGGATAA CAAACCGTTC 
CGTAGCACTT CCGGTAACAA CAACCTCAAA CTTTCCGCGG CCAGAGCATC GGTGGTGGCA 
GATAAACTGC GGGAATCCAC TCAAATCAAC GAAACCCATC AGCGAGAAAT AAGTGCCATC 
GGACGGGGGG AGAGCGATCC TTTAGCTGAC AATGCAACGG AAGAAGGGCG CAAGCGTAAC 
CGGCGTGTGG ATATCCTATG GAAAATTGGT CAGCGCGATG CCGATAAGGC CATGAAGCAA 
TTCCTGGAGA ACCCAACACC AGAAGTTCAA GGAACGAATA CCCAACAATA G

Protein sequence

MNEFERQIRA AISAARNGAK HAEQSLTTPM WQAKSTVASL GGIVPRSGSS STSQAENYKE 
GLADQAASGN NMARTSAPPV TLYQQQPNAN DSYPNGNNNN PNGDNNNPNG SNNNIARVQR 
MPHGISRGLY ERPGMLLGAW DNAYIAAAMP LLLLVENIRS WPTRNAAEVR PPIVRELQYF 
QQHLQKKNYP QEDINHLSYL LCTYIDGIFN GLQTPGSYNQ SLLVEFHRDA WGGEDCFEHL 
RVYMNSPKQY REVLEFYDLI MCLGFDGKYQ MIEHGAVLLM DLRSRLHTQL YGQDATQSLA 
IAQAVKGSPR RQYIKALKIF TYGFALCLCA YGVTAWYLHQ QSQQIRSNIL TWVLPEPRKI 
NIMETLPNPL SNILNEGWLE VRKDPRGWLL IFTSDGAFRT GEATLSEEFI NKKNIERLGL 
ALAPWPGDIE VIGHTDNKPF RSTSGNNNLK LSAARASVVA DKLRESTQIN ETHQREISAI 
GRGESDPLAD NATEEGRKRN RRVDILWKIG QRDADKAMKQ FLENPTPEVQ GTNTQQ