Gene PSPTO_0165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PSPTO_0165
Symbol
ID	1181773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas syringae pv. tomato str. DC3000
Kingdom	Bacteria
Replicon accession	NC_004578
Strand	+
Start bp	184922
End bp	186427
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	60%
IMG OID	637391542
Product	sulfatase family protein
Protein accession	NP_790024
Protein GI	28867405
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID	[TIGR03417] choline-sulfatase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGCA AAAATATTCT GTTCATCATG GCCGATCAAA TGGCCGCGCC AATGTTGCCG 
TTCTACGCCC CGTCTCCCAT CCTGATGCCC AACCTGAGCC GCCTTGCTGC CGACGGCGTG 
GTGTTCGACT CGGCGTATTG CAACAGCCCG CTGTGCGCGC CTTCGCGCTT TACTCTGGTG 
AGCGGTCAGC TCCCGAGCAG GATCGGCGGG TACGACAACG CGGCGGACTT CCCGGCAGAC 
GTTCCGACCT ACGCGCACTA CCTGCGTGCG CTGGGTTACA AGACCGCGCT GTCGGGCAAG 
ATGCATTTTT GCGGGCCGGA TCAGTTGCAC GGTTACGAAG AGCGCCTGAC CAGTGACATC 
TACCCGGCCG ACTACGGCTG GTCGGTCAAT TGGGACGAGC CGGACGTACG CCCGAGCTGG 
TATCACAACA TGTCATCGGT ATTGCAGGCC GGCCCGTGCG TGCGCACCAA CCAGCTGGAT 
TTCGATGAAG AGGTGCTGTT CAAGGCTCAG CAGTACCTCT ACGACCATGT GCGTCAGGAC 
GGTGATGCGC CGTTCTGCCT GACCGTTTCC ATGACTCACC CTCACGACCC GTACACCATC 
CCGCGTCCGT TCTGGGACCT GTACAGCGAC GACGAAATCC CGATGCCAAC GCCGCACGCC 
AATCAGGCCG CGCTGGACCC GCACTCACAA CGGCTGCTCA AGGTGTATGA CCTGTGGGAC 
AAGCCGATGC CGACAAACAA GATTCGTGAT GCGCGCCGTG CCTATTTCGG CGCGTGCAGC 
TACATCGACC TGAACGTCGG CAAGCTGATG CAGACGCTTG ATGAGGTCGG GCTGGCGGAC 
GACACCATCG TGGTGTTCTC TGGCGATCAC GGCGACATGC TGGGCGAGAA GGGTCTCTGG 
TACAAAATGC ACTGGTTCGA AATGGCCGCT CGCGTGCCGC TGGTGGTGTA CGCGCCGGGG 
CAGTTCAAGC CGGGGCGGGT CAGTGCGTCG GTGTCGACGG CCGACCTGTT ACCGACCTTT 
GTCGAAATGG CCAAGGGCAC ACTGGACGCC GGCTTGCCGC TGGACGGGCG CTCGCTGATG 
CCGCACCTGA AACGCAAAGG CGGGCACGAT GAGGTGTTTG GCGAATACAT GGCCGAAGGC 
ACGACCAGCC CGCTGATGAT GATCCGTCGC GGTGCGTACA AATTCATCTA TTCGGAACAG 
GACCCGTGCC TGTTGTTCGA TGTGAAGAAA GACCCGAAAG AGCAGAAAGA CCTGAGCCAG 
TCGCCAGCCC ATGAAAAGCT GTTCAATGAT TTTCTGGCCG AAGCTCGGGC CAAGTGGGAC 
ATACCGGCGA TACACCAACA GGTGCTCGCC AGCCAGCGCA GAAGGCGCTT TGTCGCCAAA 
TCGCTGGCAA CCGGCAAGCT GAAGAGTTGG GATCACCAGC CACTGGTCGA CGCCAGTCAG 
CAGTACATGC GCAACCACAT TGATCTCGAC GATCTGGAGC GCAAGGCACG TTTTCCGCAA 
CCTTGA

Protein sequence

MKRKNILFIM ADQMAAPMLP FYAPSPILMP NLSRLAADGV VFDSAYCNSP LCAPSRFTLV 
SGQLPSRIGG YDNAADFPAD VPTYAHYLRA LGYKTALSGK MHFCGPDQLH GYEERLTSDI 
YPADYGWSVN WDEPDVRPSW YHNMSSVLQA GPCVRTNQLD FDEEVLFKAQ QYLYDHVRQD 
GDAPFCLTVS MTHPHDPYTI PRPFWDLYSD DEIPMPTPHA NQAALDPHSQ RLLKVYDLWD 
KPMPTNKIRD ARRAYFGACS YIDLNVGKLM QTLDEVGLAD DTIVVFSGDH GDMLGEKGLW 
YKMHWFEMAA RVPLVVYAPG QFKPGRVSAS VSTADLLPTF VEMAKGTLDA GLPLDGRSLM 
PHLKRKGGHD EVFGEYMAEG TTSPLMMIRR GAYKFIYSEQ DPCLLFDVKK DPKEQKDLSQ 
SPAHEKLFND FLAEARAKWD IPAIHQQVLA SQRRRRFVAK SLATGKLKSW DHQPLVDASQ 
QYMRNHIDLD DLERKARFPQ P