Gene SNSL254_A0958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0958
Symbol
ID	6483648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	960562
End bp	962049
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	51%
IMG OID	642736364
Product	sulfatase
Protein accession	YP_002040124
Protein GI	194444340
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0959773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	108
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TTATTCTGCT GTTTGACAGT CTGAATAAAA ACTATTTGCC GCCCTATGGT 
GATTTGCTAA CGAAAGCGCC TAACTTTCAA CGCCTGGCGG CACATGCCGC CACCTTTGAC 
AATAGTTATG TCGGCAGTAT GCCCTGTATG CCAGCCCGTC GGGAACTGCA CACCGGGCGC 
TATAATTTCC TGCATCGTGA GTGGGGGCCG CTGGAACCCT TTGATGATTC CATGCCGGAA 
TTATTGAAAA AAGCGGGGAT CTACACCCAT CTTATCAGCG ATCATCTGCA TTACTGGGAA 
GACGGCGGCG GTAACTACCA TAACCGCTAT AGCTCCTGGG ACGTAGTACG CGGTCAGGAG 
GGCGATCACT GGAAGGCAAG CGTTGGCGAG CCGCCCATTC CGGAAGTACT GCGCGTTCCA 
CAAAAACAAA CCGGAGGCGG CGTTTCCGGG CTATGGCGTC ATGACTGGGC GAACCGCGAA 
TACATCCAGC AGGAAGCCGA TTTTCCCCAG ACGAAAGTTT TTGACGCCGG GTGCGATTTT 
ATCCATAAAA ATCATGCCGA AGATAACTGG TTATTGCAGG TTGAGACGTT CGATCCGCAT 
GAGCCGTTTT ATACCACCGA GGAATATTTA TCGCTCTATG AAGATGAGTG GCAAGGTCCG 
CATTATGACT GGCCGCGCGG CAAAGTCAGT GAAAGTGAGG AGGCGATAGC GCATATTCGC 
TGTCGTTATC GGGCCCTGGT TTCCATGTGC GACCGCAATC TGGGACGTAT CCTTGATCTG 
ATGGATGAAC ACGATCTCTG GCGCGATACG ATGCTGATTG TCGGTACCGA TCACGGCTTC 
TTGCTGGGGG AGCACGGTTG GTGGGCTAAA AATCAAATGC CCTATTATAA CGAGGTGGCG 
AATAACCCGC TGTTTATCTG GGACCCGCGC AGCGCGGTAT GCGGAGCGCG ACGGCAGTCG 
CTGGTGCAGA TGATTGACTG GGCGCCAACG CTACTGGATT ATTTTCAGCA ACCTATTCCC 
GCAGATATGC AGGGCCAACC ACTGGCGAAA GTCATTGCCA GTGATGAACC CGTCAGGGAA 
GGCGCGCTGT TTGGCGTGTT TAGCGGACAT GTTAATGTTA CCGACGGACG CTATGTTTAT 
ATGCGGGCCG CGCAGCCGGG GCGTGAGCAT GACATTGCGA ACTACACGTT AATGCCGATC 
AAGATGAATG CGCGTTATGA TGTGGATGAA CTGGGAAAAT TATCTCTGGC ACCTCCGTTT 
AACTTTACTA AAGGGCTTCA GGTATTACGT ATTCCGGCCA GGGAAAAATA TAAAGGTGTG 
AATAGCTTTG GTCATCTCTT GTTTGATCTC AGAGACGATC CGCAGCAGCA ACATCCTATT 
CATGATGAGG CCATCGAAGC AAGGATGAGC AACTTACTTA TCCGTTTGAT GAAAGAAAAT 
GATGCTCCGG CGGAGCAGTA TCGCCGTCTG GGTCTGGATG TTATCTAA

Protein sequence

MKAIILLFDS LNKNYLPPYG DLLTKAPNFQ RLAAHAATFD NSYVGSMPCM PARRELHTGR 
YNFLHREWGP LEPFDDSMPE LLKKAGIYTH LISDHLHYWE DGGGNYHNRY SSWDVVRGQE 
GDHWKASVGE PPIPEVLRVP QKQTGGGVSG LWRHDWANRE YIQQEADFPQ TKVFDAGCDF 
IHKNHAEDNW LLQVETFDPH EPFYTTEEYL SLYEDEWQGP HYDWPRGKVS ESEEAIAHIR 
CRYRALVSMC DRNLGRILDL MDEHDLWRDT MLIVGTDHGF LLGEHGWWAK NQMPYYNEVA 
NNPLFIWDPR SAVCGARRQS LVQMIDWAPT LLDYFQQPIP ADMQGQPLAK VIASDEPVRE 
GALFGVFSGH VNVTDGRYVY MRAAQPGREH DIANYTLMPI KMNARYDVDE LGKLSLAPPF 
NFTKGLQVLR IPAREKYKGV NSFGHLLFDL RDDPQQQHPI HDEAIEARMS NLLIRLMKEN 
DAPAEQYRRL GLDVI