Gene SeSA_A0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A0040
Symbol
ID	6516353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	40130
End bp	41623
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	52%
IMG OID	642745215
Product	sulfatase
Protein accession	YP_002113047
Protein GI	194734352
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.872346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.13967
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGAT CAGTCGTTGC CAGTATGATA GGGTTGGCGC TATGCGCTGG AAGCGTATTA 
TCAACCGCGC AAGCGGCAAC CGCAAAGCGT CCTAACTTAG TCATTATTCT GGCAGATGAT 
TTAGGGTATG GCGATCTCGC CACCTACGGG CACCGCATCG TTAAAACACC TAACATAGAC 
AAATTGGCGC AGGAGGGGGT GAAGTTTACC GACTATTATG CGCCAGCGCC TCTGTGTTCT 
CCTTCCCGCG CGGGCCTGTT AACCGGCCGT ATGCCGTTCC GTACCGGAAT CCGTTCCTGG 
ATACCGGAAG GCAAAGATGT TGCGCTGGGG CGTAATGAAC TGACTATCGC CAACCTGCTA 
AAACAGCAGG GCTACGATAC GGCGATGATG GGGAAATTAC ACCTGAATGC GGGCGGCGAT 
CGCACCGATC AGCCGCAGGC GAAAGACATG GGCTTTGACT ATACGTTGGT TAATCCGGCG 
GGATTTGTCA CCGATGCTAC GTTGGACAAC GCCAAGGAGC GCCCGCGCTA TGGCGTGGTG 
CATCCTACGG GGTGGATTCG TAATGGCCAA CATATTGGCC GCGCAGATAA GATGAGCGGC 
GAGTTTGTGA GCTCTGAAGT GGTGAACTGG CTGGATAATA AGAAAGACGA TAATCCGTTC 
TTCTTATATG TCGCCTTTAC CGAAGTCCAT AGCCCGCTGG CGTCGCCGAA AAAATACCTT 
GATATGTATT CGCAGTACAT GACCGACTAC CAGAAGCAGC ATCCGGATCT GTTCTACGGC 
GACTGGGCAG ACAAACCGTG GCGCGGCACC GGCGAATATT ACGCCAATAT CAGCTACATG 
GATGAGCAGG TCGGTAAAGT GCTGGATAAA ATTAAGGCGA TGGGCGAGGA AGATAACACC 
ATCGTCATCT TTACCAGCGA CAACGGCCCT GTCACGCGTG AAGCGCGTAA GGTATACGAG 
CTGAACCTGG CCGGGGAAAC CGACGGTCTG CGCGGGCGTA AAGACAACCT GTGGGAAGGC 
GGCATTCGCG TACCGGCAAT CATCAAATAC GGCAAGCACA TTCCACAGGG GATGGTAACG 
GACACGCCGG TATATGGTCT TGACTGGCTG CCGACGCTGG CCAACATGAT GGACTTTAAA 
CTTCCGACCG ATCGTACCTA CGACGGTCAG TCTTTAGTTC CGCTCCTGAA GGACAAGACT 
TTAAAACGCC AGAAACCGCT GATCTTCGGT ATCGATATGC CGTTCCAGGA TGATCCGACG 
GATGAGTGGG CGATCCGCGA CGGCGACTGG AAGATGATCA TCGATCGCCA GAATAAACCT 
AAATATCTCT ATAACCTGAA AACCGATCGT TTCGAGACGC TCAATCAAAT TGGTAAACAG 
CCGCAGATTG AGAAACAGCT CTACGGTAAG TTCCTGAAGT ATAAAAAGGA TATTGATAAC 
GATTCTCTGA TGAAAGCCCG TGGCGATAAG CCGACGCCTG TCACCTGGGG CTAA

Protein sequence

MKRSVVASMI GLALCAGSVL STAQAATAKR PNLVIILADD LGYGDLATYG HRIVKTPNID 
KLAQEGVKFT DYYAPAPLCS PSRAGLLTGR MPFRTGIRSW IPEGKDVALG RNELTIANLL 
KQQGYDTAMM GKLHLNAGGD RTDQPQAKDM GFDYTLVNPA GFVTDATLDN AKERPRYGVV 
HPTGWIRNGQ HIGRADKMSG EFVSSEVVNW LDNKKDDNPF FLYVAFTEVH SPLASPKKYL 
DMYSQYMTDY QKQHPDLFYG DWADKPWRGT GEYYANISYM DEQVGKVLDK IKAMGEEDNT 
IVIFTSDNGP VTREARKVYE LNLAGETDGL RGRKDNLWEG GIRVPAIIKY GKHIPQGMVT 
DTPVYGLDWL PTLANMMDFK LPTDRTYDGQ SLVPLLKDKT LKRQKPLIFG IDMPFQDDPT 
DEWAIRDGDW KMIIDRQNKP KYLYNLKTDR FETLNQIGKQ PQIEKQLYGK FLKYKKDIDN 
DSLMKARGDK PTPVTWG