Gene YpsIP31758_3537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3537
Symbol
ID	5385319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	3994346
End bp	3995605
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	37%
IMG OID	640866552
Product	putative type I restriction-modification system, S subunit
Protein accession	YP_001402491
Protein GI	153947182
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATGG ATAATATGGT ACCGGAGATT CGCTTTGAAG GGTTCAGTAC AAACTGGCTC 
AATTTCAATT TAAGTCAGAT TACTGATGTC TATGATGGAA CTCATCAAAC GCCCGCATAT 
ACAAAAAGTG GCGTAATGTT TCTTTCGGCA GAGAATATCA AGTCTTTAAC TTCAACGAAA 
TTTATTTCAG AAGAGGCATT TAAGAAGGAA TTTAAGGTAT ACCCAAAAAA AAATGATGTA 
CTAATGACCA GAATAGGCGA CGTTGGAACT GCAAACGTTG TTGAAACTGA TGATGATAGA 
GCTTATTACG TGACTCTAGC ATTATTAAAA TATAAAAAGA TAAGTCCATA TTTTTTAAAA 
AGTTCAATCG CGTCACCATT TGTTCAAAAA GATATTTGGC TTCGAACTCT ACATATTGCA 
TTCCCTAAAA AGATCAATAT GAATGAAATT AAGAAAGTTG CGGTTAACTG CCCACCAGAT 
GTTGTTGAGT CTGATAAGAT CGGCCAATAT TTCAAAAATC TCGATGCACT GATCAACCAG 
CACCAACAAA AGCATGACAA ACTCAGCAAC ATTAAAAAAG CCATGCTGGA AAAGATGTTC 
CCCAAACCAG GCAAAACCAT CCCAGAAATC CGCTTTAAAG GGTTTAGTGG GGAGTGGGAG 
GAGATGCCAT TTGGAGCTTG CTTTATTAAC GTGTCGAACA ATACTCTTTC TAGAGCCGAT 
CTGAATTATG ACGATGGAAT GGCAAAAAAT ATTCACTATG GCGATGTATT AATTAAATTC 
GGTGAAGTTC TAGATGCAAC TAATGAGCTT TTGCCTTTTA TTACAAATAA TGACGTAGCC 
AATAAGCTAA AACATGCCGC CTTGCGCGAT GGTGATATTA TCATTGCAGA TGCTGCTGAA 
GATAGTATGG TTGGAAAATG CACCGAGCTA TTTAATATAG GTGAGCAGTT AGTTCTTTCT 
GGATTGCACA CAATTGCGGT TAGGCCTACG TTGACTTTTG CTTCTAAATA TCTTGGATAC 
TACTTAAATT CATCTTCATA CCATGATCAG CTTTTGTCAT TGATGCAAGG TACAAAAGTA 
TTATCAATAT CAAGGACTGC AATACAGAAC ACAAATATTG TGTTTCCAAA GAGTGCGGAA 
GAACAAGTCG AAATAGGCAA CTATTTCCAA AAGCTCGACG CACTGATCAA CCAGCACCAA 
CAACAAATCA CCAAACTCAA TAACATCAAG CAGGCCTGCT TGAGCAAAAT GTTTATATAG

Protein sequence

MSMDNMVPEI RFEGFSTNWL NFNLSQITDV YDGTHQTPAY TKSGVMFLSA ENIKSLTSTK 
FISEEAFKKE FKVYPKKNDV LMTRIGDVGT ANVVETDDDR AYYVTLALLK YKKISPYFLK 
SSIASPFVQK DIWLRTLHIA FPKKINMNEI KKVAVNCPPD VVESDKIGQY FKNLDALINQ 
HQQKHDKLSN IKKAMLEKMF PKPGKTIPEI RFKGFSGEWE EMPFGACFIN VSNNTLSRAD 
LNYDDGMAKN IHYGDVLIKF GEVLDATNEL LPFITNNDVA NKLKHAALRD GDIIIADAAE 
DSMVGKCTEL FNIGEQLVLS GLHTIAVRPT LTFASKYLGY YLNSSSYHDQ LLSLMQGTKV 
LSISRTAIQN TNIVFPKSAE EQVEIGNYFQ KLDALINQHQ QQITKLNNIK QACLSKMFI