Gene YpsIP31758_1263 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1263
Symbol
ID	5387269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	1481692
End bp	1483296
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	42%
IMG OID	640864240
Product	sulfatase
Protein accession	YP_001400243
Protein GI	153948293
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGGCC CTGCATATGC TGATGATGTC AAACTCAAAG CAACAAACAC CAATGTTGCT 
TTCGCTGATT TTACGCCAAA AGAATACAGC ACGAAGAATA AGCCAAATAT CATTGTATTA 
ACCATGGATG ACTTAGGTTA TGGGCAGCTC CCTTTTGATA AGACCTCCTT TGACCCGAAG 
TCGATGGAAG ATCGGGACGT TGTTGATACC TACAAAATAG GCATTGATAA AGCCATTGAA 
GCCGCCAAAA AGTCCACGCC AACACTACTC TCGTTGATGG ATGAAGGGGT TCGTCTGACG 
AATGGCTACG TTGCTCATGG CGTATCAGGG CCTTCGCGGG CGGCCATTAT GACGGGCCGG 
TCCCCTGCAA GGTTTGGTGT TTACTCCAAT ACCGATGCTC AGAATGGGAT TTCATTAGAA 
GAGACATTCC TGCCTGAGTT ATTGCAAAAC AATGGCTATT ACACGGCGGC CATCGGAAAA 
TGGCATCTTT CAAAAATCAG TAATGTTCCT GTTCCTGAAG CGGAGCAAAC GCGCGATTAC 
CACGATAACT TTACAACTTA CTCAGCCGAT GAATGGCAGC CTCAAAACCG AGGCTTCCAG 
TATTTTATGG GTTACCATGC CGCGGGAACG GCTTATTATA ATTCCCCGTC TCTTTTCCAT 
AATAAAGAGC GGGTGAAAGC CAAAGGTTAT ATCAGTGATC AACTTACCGA TGAGGCTATC 
GGTGTTGCCA ATAGAGCTAA ATCCTTAGAT GAGCCATTCA TGATGTATTT GGCTTACAGT 
GCTCCCCATT TACCTAATGA TAATCCAGCG CCGGATGAAT ATCAGAAACA CTTTAATACA 
GGTAGCCAAA CTGCTGATAA CTTCTATGCC TCTGTCTATT CTGTTGACCA GGGCGTAAAA 
CGGCTTCTTG AGCAGCTTAA AAAGAATGGT CAATATGACA ATACGATAAT TATGTTTACC 
TCTGATAACG GTGCCGTTAT CGATGGGCCA TTACCGTTGA ACGGTAATCA GAAAGGGTAT 
AAAAGCCAAA CATTTCCTGG CGGAACCCAT ACTCCAATGT TTATTTGGTG GAAGGGGAAA 
TTGCAAACAG GAAATTATGA CAAGTTGATC TCTGCAATGG ATTTCATGCC TACAGCGCTT 
GAAGCCGCTG AGATTGATGC TCCAAATAAT TTAGATGGTG TCTCACTGCT TCCTTATTTG 
ACGGGGAAAA GCAAAGCTGA ACCGCATAAA TATCTTACCT GGGTGACATC CTATACCCAC 
TGGTTCGATG AAGAGAATAT TCCATTCTGG GATGGTTACC ATAAATTTGT GCGTAATGAA 
TCCAATGAAT ATCCTAAAAA CCCAAATACC GAAGATCTTA GTCAATTCTC TTATACCATC 
CGCAGTAATG ACTACTCTTT AACCTATACC TATGAAGGTA ATAAGTTAAA TTTGTATAAA 
CTGAGTGATT TAAATCAAAA ACAAGACCTT GCAAGTACCC ATCCTGATGT TGTTAAGGTA 
ATGCAAGCCG AGATGAGGAA CTTCATTAAT CAGAGTCAAT CTCCTGTTAG TGAAGTTAAT 
CAGGATAAAT TTAATAAAAT TAAGCAATCG CTTGGCATGA ATTAA

Protein sequence

MGGPAYADDV KLKATNTNVA FADFTPKEYS TKNKPNIIVL TMDDLGYGQL PFDKTSFDPK 
SMEDRDVVDT YKIGIDKAIE AAKKSTPTLL SLMDEGVRLT NGYVAHGVSG PSRAAIMTGR 
SPARFGVYSN TDAQNGISLE ETFLPELLQN NGYYTAAIGK WHLSKISNVP VPEAEQTRDY 
HDNFTTYSAD EWQPQNRGFQ YFMGYHAAGT AYYNSPSLFH NKERVKAKGY ISDQLTDEAI 
GVANRAKSLD EPFMMYLAYS APHLPNDNPA PDEYQKHFNT GSQTADNFYA SVYSVDQGVK 
RLLEQLKKNG QYDNTIIMFT SDNGAVIDGP LPLNGNQKGY KSQTFPGGTH TPMFIWWKGK 
LQTGNYDKLI SAMDFMPTAL EAAEIDAPNN LDGVSLLPYL TGKSKAEPHK YLTWVTSYTH 
WFDEENIPFW DGYHKFVRNE SNEYPKNPNT EDLSQFSYTI RSNDYSLTYT YEGNKLNLYK 
LSDLNQKQDL ASTHPDVVKV MQAEMRNFIN QSQSPVSEVN QDKFNKIKQS LGMN