Gene SeD_A0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0038
Symbol
ID	6871417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	40129
End bp	41622
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	53%
IMG OID	642783296
Product	sulfatase
Protein accession	YP_002213990
Protein GI	198243820
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.292867
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.00560398
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAGAA CAGTCGTTGC CAGTATGATA GGGTTGGCGC TATGCGCTGG ATGCGTATTA 
TCAACCGCGC AAGCGGCAAC CGCAAAGCGT CCTAACTTAG TCATTATTCT GGCGGATGAT 
TTAGGGTATG GCGATCTCGC CACCTACGGG CACCGCATCG TTAAAACACC TAACATAGAC 
AAATTGGCGC AGGAGGGGGT GAAGTTTACC GACTATTATG CGCCAGCGCC TCTGTGTTCT 
CCTTCCCGCG CGGGCCTGTT AACCGGTCGT ATGCCGTTCC GTACCGGAAT CCGTTCCTGG 
ATACCGGAAG GCAAAGATGT TGCGCTGGGG CGTAATGAAC TGACTATCGC CAATCTGCTA 
AAACAGCAGG GCTACGATAC AGCGATGATG GGGAAATTAC ACCTGAATGC GGGCGGCGAT 
CGCACCGATC AGCCGCAGGC GAAAGACATG GGCTTTGACT ATACGTTGGT TAATCCGGCG 
GGATTTGTCA CCGATGCTAC GCTGGATAAC GCCAAGGAGC GCCCGCGCTA TGGCGTGGTG 
CATCCTACGG GGTGGATTCG TAATGGCCAA CATATTGGCC GCGCAGATAA GATGAGCGGC 
GAGTTTGTGA GCTCTGAAGT GGTGAACTGG CTGGATAATA AGAAAGACGA TAATCCGTTC 
TTCTTATATG TCGCCTTTAC CGAAGTCCAT AGCCCGCTGG CGTCGCCGAA AAAATACCTT 
GATATGTATT CGCAGTACAT GACCGACTAC CAGAAGCAGC ATCCGGATCT GTTCTACGGC 
GACTGGGCAG ACAAACCGTG GCGCGGCACC GGCGAATATT ACGCCAATAT CAGCTACATG 
GATGAGCAGG TCGGTAAAGT GCTGGATAAA ATTAAGGCGA TGGGCGAGGA AGATAACACC 
ATCGTCATCT TTACCAGCGA CAACGGCCCT GTCACGCGCG AAGCGCGTAA GGTATACGAG 
CTGAACCTGG CCGGGGAAAC CGACGGTCTG CGCGGGCGTA AAGACAACCT GTGGGAAGGC 
GGCATTCGCG TACCGGCAAT CATCAAATAC GGCAAGCACA TTCCACAGGG GATGGTAACG 
GACACGCCGG TATATGGTCT TGACTGGTTG CCGACGCTGG CCAACATGAT GGACTTTAAA 
CTCCCGACCG ATCGTACCTA CGACGGTCAG TCTTTAGTTC CGCTCCTGAA GGACAAGACG 
TTAAAACGCC AGAAACCGCT GATCTTCGGT ATCGATATGC CGTTCCAGGA CGATCCGACG 
GATGAGTGGG CGATCCGCGA CGGCGACTGG AAGATGATCA TCGATCGCCA GAGTAAACCT 
AAATATCTCT ATAACCTGAA AACCGATCGT TTCGAGACGC TCAATCAAAT TGGTAAACAG 
CCGCAGATTG AGAAACAGCT TTACGGTAAG TTCCTGAAGT ATAAAAAGGA TATTGATAAC 
GATTCGCTGA TGAAAGCCCG TGGCGATAAG CCGACGCCTG TCACCTGGGG CTAA

Protein sequence

MKRTVVASMI GLALCAGCVL STAQAATAKR PNLVIILADD LGYGDLATYG HRIVKTPNID 
KLAQEGVKFT DYYAPAPLCS PSRAGLLTGR MPFRTGIRSW IPEGKDVALG RNELTIANLL 
KQQGYDTAMM GKLHLNAGGD RTDQPQAKDM GFDYTLVNPA GFVTDATLDN AKERPRYGVV 
HPTGWIRNGQ HIGRADKMSG EFVSSEVVNW LDNKKDDNPF FLYVAFTEVH SPLASPKKYL 
DMYSQYMTDY QKQHPDLFYG DWADKPWRGT GEYYANISYM DEQVGKVLDK IKAMGEEDNT 
IVIFTSDNGP VTREARKVYE LNLAGETDGL RGRKDNLWEG GIRVPAIIKY GKHIPQGMVT 
DTPVYGLDWL PTLANMMDFK LPTDRTYDGQ SLVPLLKDKT LKRQKPLIFG IDMPFQDDPT 
DEWAIRDGDW KMIIDRQSKP KYLYNLKTDR FETLNQIGKQ PQIEKQLYGK FLKYKKDIDN 
DSLMKARGDK PTPVTWG