Gene SeSA_A1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1039
Symbol
ID	6518917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1009367
End bp	1010854
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	52%
IMG OID	642746167
Product	sulfatase
Protein accession	YP_002113978
Protein GI	194738182
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TTATTCTGCT GTTTGACAGT CTGAATAAAA ACTATTTGCC GCCCTATGGC 
GATTTGCTAA CGAAAGCGCC TAACTTTCAA CGCCTGGCGG CACATGCCGC CACCTTTGAC 
AATAGTTATG TCGGCAGTAT GCCCTGTATG CCAGCCCGTC GGGAACTGCA CACCGGGCGC 
TATAATTTCC TGCATCGTGA GTGGGGCCCG CTGGAACCCT TTGATGATTC CATGCCGGAA 
TTATTGAAAA AAGCGGGGAT CTACACCCAT CTTATCAGCG ATCATTTGCA TTACTGGGAA 
GACGGCGGCG GTAACTACCA TAACCGCTAT AGCTCCTGGG ACGTAGTACG CGGTCAGGAG 
GGCGATCACT GGAAGGCAAG TGTTGGCGAG CCGCCCATTC CGGAAGTACT GCGCGTTCCA 
CAAAAACAAA CCGGAGGCGG CGTTTCCGGG CTATGGCGTC ATGACTGGGC GAACCGCGAA 
TACATCCAGC AGGAAGCCGA TTTTCCCCAG ACGAAAGTTT TTGACGCCGG GTGCGATTTT 
ATCCATAAAA ATCATGCCGA AGATAACTGG TTATTGCAGG TTGAGACGTT CGATCCGCAT 
GAACCGTTTT ATACCACCGA GGAATATTTA TCGCTCTATG ACGATGAGTG GCAAGGCCCG 
CATTATGACT GGCCGCGCGG CAAAGTCAGT GAAAGCGAGG AGGCGATAGC GCATATTCGC 
TGTCGTTATC GGGCCCTGGT TTCCATGTGC GACCGCAATC TTGGACGTAT CCTTGATCTG 
ATGGATGAAC ACGATCTCTG GCGCGATACG ATGCTGATTG TCGGTACCGA TCACGGCTTC 
TTGCTGGGGG AGCACGGTTG GTGGGCTAAA AATCAAATGC CCTATTATAA CGAGGTGGCG 
AATAACCCGC TGTTTATCTG GGACCCGCGC AGCGCGGTAT GCGGAGCGCG GCGGCAGTCG 
CTGGTGCAGA TGATTGACTG GGCGCCAACG CTACTGGATT ATTTTCAGCA ACCTATTCCC 
GCAGATATGC AGGGCCAACC GCTGGCGAAA GTCATTGCCA GTGATGAACC CGTCAGGGAA 
GGCGCGCTGT TTGGCGTGTT TAGCGGACAT GTTAATGTTA CCGACGGACG CTATGTTTAT 
ATGCGGGCCG CGCAACCGGG GCGTGAGCAT GACATTGCGA ACTACACGTT AATGCCGATC 
AAGATGAATG CGCGTTATGA CGTGGATGAA CTGGGAAAAT TATCTCTGGC ACCTCCGTTT 
AAATTCACTA AAGGGCTTCA GGTATTACGT ATTCCGGCCA GGGAAAAATA TAAAGGTGTG 
AATAGCTTTG GTCATCTCTT GTTTGATCTC AGAGACGATC CGCAGCAGCA ACATCCTATT 
CATGATGAGG CCATCGAAGC AAGGATGATC AACTTACTTA TCCGTTTGAT GAAAGAAAAT 
GATGCTCCGG CGGAGCAGTA TCGCCGTCTG GGTCTGGATG TTATCTAA

Protein sequence

MKAIILLFDS LNKNYLPPYG DLLTKAPNFQ RLAAHAATFD NSYVGSMPCM PARRELHTGR 
YNFLHREWGP LEPFDDSMPE LLKKAGIYTH LISDHLHYWE DGGGNYHNRY SSWDVVRGQE 
GDHWKASVGE PPIPEVLRVP QKQTGGGVSG LWRHDWANRE YIQQEADFPQ TKVFDAGCDF 
IHKNHAEDNW LLQVETFDPH EPFYTTEEYL SLYDDEWQGP HYDWPRGKVS ESEEAIAHIR 
CRYRALVSMC DRNLGRILDL MDEHDLWRDT MLIVGTDHGF LLGEHGWWAK NQMPYYNEVA 
NNPLFIWDPR SAVCGARRQS LVQMIDWAPT LLDYFQQPIP ADMQGQPLAK VIASDEPVRE 
GALFGVFSGH VNVTDGRYVY MRAAQPGREH DIANYTLMPI KMNARYDVDE LGKLSLAPPF 
KFTKGLQVLR IPAREKYKGV NSFGHLLFDL RDDPQQQHPI HDEAIEARMI NLLIRLMKEN 
DAPAEQYRRL GLDVI