Gene SeSA_A3378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3378
Symbol
ID	6516789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	3260738
End bp	3262534
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	49%
IMG OID	642748374
Product	arylsulfate sulfotransferase
Protein accession	YP_002116147
Protein GI	194735024
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.953621
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGACC AATACCGGAA AACAATACTT GCCGGTGCCG TCGCACTGAC ATGCGGACTC 
ACCGCAGCCA GTACATTTGC CGCAGGTTTT CAACCGGCGC AGCCCGCAGG AAAATTAGGC 
GCAGTCGTTG TCGATCCTTA CGGTAATGCC CCTCTCACCG CACTGGTGGA ATTAGATAGC 
CATGTTATTT CAGACGTTAA AGTTACTGTA CATGGCAAAG GGGAAAAAGG CGTTCCCGTT 
ACTTATACTG TTGGGAAAGA GTCTTTAGAA ACCTATGACG GTATTCCTAT TTTTGGCCTT 
TATCAGAAAT TTGCCAACAA CGTCACGGTA GAATATAAAG AAAACGGCAA AGCCATGAAG 
GATGACTATG TGGTGCAGAC GTCCGCCATC GTCAACCATT ATATGGATAA CCGTTCTATT 
TCAGATCTCC AGCAAACGAA AGTTATTAAA GTTGCGCCAG GATTTGAAGA TCGCCTTTAT 
CTGGTAAATA CCCATACCTT TACGCCGCAG GGCGCTGAAT TTCACTGGCA CGGCGAAAAA 
GATAAAAATG CGGGCATTCT TGATGCCGGT CCGGCGGGCG GGGCTTTGCC TTTCGATATC 
GCCCCTTATA CGTTTGTGGT CGACACCCAG GGTGAATACC GCTGGTGGCT GGATCAAGAT 
ACCTTCTACG ACGGCCACGA TATGAATATC AACAAACGCG GCTATCTGAT GGGTATTCGT 
GAAACGCCTC GCGGCACCTT TACCGCGGTG CAGGGCCAAC ACTGGTACGA GTTTGACATG 
ATGGGGCAAA TTCTTGCCGA TCATAAACTG CCGCGCGGGT TCCTGGATGC GTCTCATGAA 
TCCATCGAAA CCGTGAACGG CACCGTACTG CTGCGCGTCG GCAAACGCGA TTACCGCAAA 
GAAGACGGCA TACATGTTCA TACTATTCGT GACCAAATCA TTGAGGTTGA TAAGTCTGGC 
CGCGTAGTAG ACGTTTGGGA TTTAACCAAA ATCCTCGACC CTATGCGTGA TGCGCTGCTC 
GGCGCGCTGG ATGCGGGCGC AGTATGCGTG AACGTCGATC TGGCCCATGC CGGACAGCAG 
GCGAAACTTG AACCGGATAC GCCGTATGGC GATGCGCTTG GCGTTGGTGC CGGTCGTAAC 
TGGGCGCACG TCAACTCTAT CGCTTATGAC GCGAAAGACG ACTCCATCAT CCTTTCTTCC 
CGCCATCAGG GTATTGTAAA AATTGGTCGC GATAAGCAGG TGAAATGGAT ACTGGCACCG 
TCTAAAGGCT GGAATAAGCA GCTAGCCAGT AAATTGCTGA AACCGGTAGA CGATCATGGT 
AAGCCGTTGA CCTGTGACGA AAATGGCAAG TGTAAGGACA CCGATTTCGA TTTCACCTAT 
ACCCAACATA CGGCATGGCT TTCCAGCAAA GGCACGTTAA CGGTCTTTGA TAACGGCGAT 
GGTCGCGGCC TGGAGCAACC GGCTCTACCG ACCATGAAAT ATTCCCGTTT TGTCGAATAT 
AAGATCGATG AGAAGAAAGG CACCGTACAA CAAGTTTGGG AATACGGTAA AGAACGTGGG 
TATGATTTCT ATAGTCCTAT TACCTCGGTT GTTGAATATC AAAAAGACCG CGACACCATG 
TTCGGCTTTG GCGGTTCTAT TAACCTGTTC GACGTTGGTA AACCCACAGT CGGCAAACTG 
AATGAGATTG ACTATAAAAC GAAAGAAGTG AAAGTTGAAA TTGATGTGCT GTCGGATAAA 
CCCAACCAGA CTCACTATCG TGCGTTACTG GTTCATCCAA CGCAAATGTT TAAATAA

Protein sequence

MFDQYRKTIL AGAVALTCGL TAASTFAAGF QPAQPAGKLG AVVVDPYGNA PLTALVELDS 
HVISDVKVTV HGKGEKGVPV TYTVGKESLE TYDGIPIFGL YQKFANNVTV EYKENGKAMK 
DDYVVQTSAI VNHYMDNRSI SDLQQTKVIK VAPGFEDRLY LVNTHTFTPQ GAEFHWHGEK 
DKNAGILDAG PAGGALPFDI APYTFVVDTQ GEYRWWLDQD TFYDGHDMNI NKRGYLMGIR 
ETPRGTFTAV QGQHWYEFDM MGQILADHKL PRGFLDASHE SIETVNGTVL LRVGKRDYRK 
EDGIHVHTIR DQIIEVDKSG RVVDVWDLTK ILDPMRDALL GALDAGAVCV NVDLAHAGQQ 
AKLEPDTPYG DALGVGAGRN WAHVNSIAYD AKDDSIILSS RHQGIVKIGR DKQVKWILAP 
SKGWNKQLAS KLLKPVDDHG KPLTCDENGK CKDTDFDFTY TQHTAWLSSK GTLTVFDNGD 
GRGLEQPALP TMKYSRFVEY KIDEKKGTVQ QVWEYGKERG YDFYSPITSV VEYQKDRDTM 
FGFGGSINLF DVGKPTVGKL NEIDYKTKEV KVEIDVLSDK PNQTHYRALL VHPTQMFK