Gene SeSA_A3297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3297
Symbol
ID	6518670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3180580
End bp	3182319
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	48%
IMG OID	642748297
Product	arylsulfatase
Protein accession	YP_002116070
Protein GI	194735305
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.978245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.995381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAAAAC AAGTAACACT TGCCACACTC AGCATTATCT TCTCCGGTAC GGCGCACAGT 
ACGCAAAACG AACGTCCTGA TATTATCGTG ATTATCGCTG ATGATATGGG ATATTCTGAT 
ATCACTCCCT TCGGTGGGGA AATCCCAACG CCTAATTTGC AGGCGATGGC TGAGAACGGC 
GTGCGGATGA GTCAATATTA CACGTCTCCC ATGTCTGCTC CCGCCCGTGC GATGCTATTA 
ACCGGGAACA CCAGTCAGCA AGCGGGTATA GGCGGTATGT GGTGGTATGA AAATACCATA 
GGTAAGGAAG GCTATGAATT GCGCCTGACT GATCGGGTGA CGACCATGGC TGAACGCTTT 
AAAGATGCTG GTTACAATAC GCTGATGGCG GGTAAATGGC ATCTTGGTTT TACGCCAGGC 
TCGACGCCAA AAGATCGGGG CTTTCGTCAT TCTTTCGCCT TGATGGGGGG AGGCGCCAGT 
CACTTTGATG ATGCCGTGCC GCTGGGAACC GTGGAGATAT TTCATACCTA TTATACCCGT 
GACAATCAGC GCATTTCACT GCCCTCCAGT TTTTACTCCA GCGAAGCCTA TGCCAGCCAG 
ATTAATCGCT GGATCAGCGA GACGCCACGG GAACAACCTA TCTTCGCGTG GTTGGCCTTT 
ACTGCGCCAC ATGATCCTCT GCAGGCACCG GATGAATGGA TTAGTCGTTT TAAAAGTCAG 
TATGAACAGG GCTATGCAGA CGTCTATCGT CAGCGTATTG CTCGTTTGAA GAAACTGGGT 
TTCCTGCGTG ATGACATACC TCTGCCAGGA CTGGAACTTG ATAAAGAATG GCAGGCGATG 
ACCCCGGAAC AGCAGAAATA TACGGCGAAG GTGATGCAGG TTTACGCTGC TATGATCGCC 
AATATGGATG CACAGATTGG TACCGTTATT GAGACGTTAA AAAAGACCGG GCGCGATAAA 
AACACGATTC TGGTCTTCTT AAGTGATAAT GGGGTGAATC CGGCGGAGGG CTTTCACTAT 
GAATCTGAAC CGGATTTTTG GAAGCAATTC GATAATCGTT ACGAAAATAT TGGTCGTAAA 
AATTCATTTA TCTCTTATGG TCCCCACTGG GCTGATGTCA GCAATGCGCC TTATGGTCGC 
TATCACAAAA CGACCAGCGG TCAGGGGGGA ATTAATACCA GTTTTATGAT TTCCGGTCCT 
GGTATCATCC ATAATGGCGC CATAGATAAC GCCACAATGG CGGCGTATGA TGTCGCGCCC 
ACGCTCTATG AATTTGCAGG TATTGATGTC AGTAAATCAT TATCTGAAAG ACCGACACTG 
CCAATGATCG GCGTGAGTTT TAAACGCTAT CTGACCGGTG AAAGTCTGCA CGCGCCTCGC 
ACACAATATG GTGTTGAACT CCATAATCAG GCGGCCTGGA TAGATGGGGA ATGGAAATTG 
CGTCGTCTTG TCACAGTATT CCCACAGGCG GGTAATGCGC CATGGGAATT ATTCAACCTG 
CAACGTGACC CCCTGGAAAC GCATAATCTC GCAGCAGATT ATGTGGATAA AGTGAAAATA 
CTGAGCAGTG CATATGAGGC ATTTGCAAAA CAGACAATGG TGCTTTATGC CAAAGGCAAG 
CTTATCGATT ATGTGGGTAT CGACAGTAAA ACCGGGCGTT ATCTGGCTGT CGATCCACAG 
ACATTGCAGC CAGTTCCTGC TCCGTTAGCG ATTCCTTTAG ACACAAAATC GGACCAATAA

Protein sequence

MKKQVTLATL SIIFSGTAHS TQNERPDIIV IIADDMGYSD ITPFGGEIPT PNLQAMAENG 
VRMSQYYTSP MSAPARAMLL TGNTSQQAGI GGMWWYENTI GKEGYELRLT DRVTTMAERF 
KDAGYNTLMA GKWHLGFTPG STPKDRGFRH SFALMGGGAS HFDDAVPLGT VEIFHTYYTR 
DNQRISLPSS FYSSEAYASQ INRWISETPR EQPIFAWLAF TAPHDPLQAP DEWISRFKSQ 
YEQGYADVYR QRIARLKKLG FLRDDIPLPG LELDKEWQAM TPEQQKYTAK VMQVYAAMIA 
NMDAQIGTVI ETLKKTGRDK NTILVFLSDN GVNPAEGFHY ESEPDFWKQF DNRYENIGRK 
NSFISYGPHW ADVSNAPYGR YHKTTSGQGG INTSFMISGP GIIHNGAIDN ATMAAYDVAP 
TLYEFAGIDV SKSLSERPTL PMIGVSFKRY LTGESLHAPR TQYGVELHNQ AAWIDGEWKL 
RRLVTVFPQA GNAPWELFNL QRDPLETHNL AADYVDKVKI LSSAYEAFAK QTMVLYAKGK 
LIDYVGIDSK TGRYLAVDPQ TLQPVPAPLA IPLDTKSDQ