Gene YPK_1378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_1378
Symbol
ID	6090743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	+
Start bp	1517450
End bp	1519123
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	42%
IMG OID	641596442
Product	sulfatase
Protein accession	YP_001720125
Protein GI	170023620
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAATT TAAAGGTTAA CAGGAGCATT ATTAGTGCTT CGATATCGGT CATCTTAGCT 
GCGGGCGTCA TGGGTGGCCC TGCATATGCT GATGATGTCA AACTCAAAGC AACAAACACC 
AATGTTGCTT TCGCTGATTT TACGCCAAAA GAATACAGCA CGAAGAATAA GCCAAATATC 
ATTGTCTTAA CCATGGATGA CTTAGGTTAT GGGCAGCTCC CTTTTGATAA GACCTCCTTT 
GACCCTAAGT CGATGGAAGA TCGGGACGTT GTTGATACCT ACAAAATAGG CATTGATAAA 
GCCATTGAAG CCGCCAAAAA GTCCACGCCA ACACTACTCT CGTTGATGGA TGAAGGGGTT 
CGTCTGACGA ATGGCTACGT TGCTCATGGC GTATCAGGGC CTTCGCGGGC GGCCATTATG 
ACGGGCCGGT CCCCTGCAAG GTTTGGTGTT TACTCCAATA CCGATGCTCA GAATGGGATT 
TCATTAGAAG AGACATTCCT GCCTGAGTTA TTGCAAAACA ATGGCTATTA CACGGCGGCC 
ATCGGAAAAT GGCATCTTTC AAAAATCAGT AATGTTCCTG TTCCTGAAGC GGAGCAAACG 
CGCGATTACC ACGATAACTT TACAACTTAC TCAGCCGATG AATGGCAGCC TCAAAACCGA 
GGCTTCCAGT ATTTTATGGG TTACCATGCC GCGGGAACGG CTTATTATAA TTCCCCGTCT 
CTTTTCCATA ATAAAGAGCG GGTGAAAGCC AAAGGTTATA TCAGTGATCA ACTTACCGAT 
GAGGCTATCG GTGTTGCCAA TAGAGCTAAA TCCTTAGATG AGCCATTCAT GATGTATTTG 
GCTTACAGTG CTCCCCATTT ACCTAATGAT AATCCAGCGC CGGATGAATA TCAGAAACAC 
TTTAATACAG GTAGCCAAAC TGCTGATAAC TTCTATGCCT CTGTCTATTC TGTTGACCAG 
GGCGTAAAAC GGCTTCTTGA GCAGCTTAAA AAGAATGGTC AATATGACAA TACGATAATT 
ATGTTTACCT CTGATAACGG TGCCGTTATC GATGGGCCAT TACCGTTGAA CGGTAATCAG 
AAAGGGTATA AAAGCCAAAC ATTTCCTGGC GGAACCCATA CTCCAATGTT TATTTGGTGG 
AAGGGGAAAT TGCAAACAGG AAATTATGAC AAGTTGATCT CTGCAATGGA TTTCATGCCT 
ACAGCGCTTG AAGCCGCTGA GATTGATGCT CCAAATAATT TAGATGGTGT CTCACTGCTT 
CCTTATTTGA CGGGGAAAAG CAAAGCTGAA CCGCATAAAT ATCTTACCTG GGTGACATCC 
TATACCCACT GGTTCGATGA AGAGAATATT CCATTCTGGG ATGGTTACCA TAAATTTGTG 
CGTAATGAAT CCAATGAATA TCCTAAAAAC CCAAATACCG AAGATCTTAG TCAATTCTCT 
TATACCATCC GCAGTAATGA CTACTCTTTA ACCTATACCT ATGAAGGTAA TAAGTTAAAT 
CTGTATAAAC TGAGTGATTT AAATCAAAAA CAAGACCTTG CAAGTACCCA TCCTGATGTT 
GTTAAGGTAA TGCAAGCCGA GATGAGGAAC TTCATTAATC AGAGTCAATC TCCTGTTAGT 
GAAGTTAATC AGGATAAATT TAATAAAATT AAGCAATCGC TTGGTATGAA TTAA

Protein sequence

MMNLKVNRSI ISASISVILA AGVMGGPAYA DDVKLKATNT NVAFADFTPK EYSTKNKPNI 
IVLTMDDLGY GQLPFDKTSF DPKSMEDRDV VDTYKIGIDK AIEAAKKSTP TLLSLMDEGV 
RLTNGYVAHG VSGPSRAAIM TGRSPARFGV YSNTDAQNGI SLEETFLPEL LQNNGYYTAA 
IGKWHLSKIS NVPVPEAEQT RDYHDNFTTY SADEWQPQNR GFQYFMGYHA AGTAYYNSPS 
LFHNKERVKA KGYISDQLTD EAIGVANRAK SLDEPFMMYL AYSAPHLPND NPAPDEYQKH 
FNTGSQTADN FYASVYSVDQ GVKRLLEQLK KNGQYDNTII MFTSDNGAVI DGPLPLNGNQ 
KGYKSQTFPG GTHTPMFIWW KGKLQTGNYD KLISAMDFMP TALEAAEIDA PNNLDGVSLL 
PYLTGKSKAE PHKYLTWVTS YTHWFDEENI PFWDGYHKFV RNESNEYPKN PNTEDLSQFS 
YTIRSNDYSL TYTYEGNKLN LYKLSDLNQK QDLASTHPDV VKVMQAEMRN FINQSQSPVS 
EVNQDKFNKI KQSLGMN