Gene SeD_A0990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0990
Symbol
ID	6872891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	980373
End bp	981860
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	52%
IMG OID	642784175
Product	sulfatase
Protein accession	YP_002214850
Protein GI	198243794
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TTATTCTGCT GTTTGACAGT CTGAATAAAA ACTATTTGCC GCCCTATGGT 
GATTTGCTAA CGAAAGCGCC TAACTTTCAA CGCCTGGCGG CACATACCGC CACCTTTGAC 
AATAGTTATG TCGGCAGTAT GCCCTGTATG CCAGCCCGTC GGGAACTGCA CACCGGGCGC 
TACAACTTTC TGCATCGTGA GTGGGGGCCG CTGGAACCCT TTGATGATTC CATGCCGGAA 
TTATTGAAAA AAGCGGGGAT CTACACCCAT CTTATCAGCG ATCATCTGCA TTACTGGGAA 
GACGGCGGCG GTAACTACCA TAACCGCTAT AGCTCCTGGG ACGTAGTACG CGGTCAGGAG 
GGCGATCACT GGAAGGCAAG TGTTGGCGAG CCGCCCATTC CGGAAGTACT GCGCGTTCCA 
CAAAAACAAA CCGGAGGCGG CGTTTCCGGG CTATGGCGTC ATGACTGGGC GAACCGCGAA 
TACATCCAGC AGGAGGCCGA TTTTCCCCAG ACGAAAGTTT TTGACGCAGG GTGCGATTTT 
ATCCATAAAA ATCATGCCGA AGATAACTGG TTATTGCAGG TTGAGACGTT CGATCCGCAT 
GAGCCGTTTT ATACCACCGA GGAATATTTA TCGCTCTATG ACGATGAGTG GCAAGGCCCG 
CATTATGACT GGCCGCGCGG CAAAGTCAGT GAAAGCGAGG AGGCGATAGC GCATATTCGC 
TGTCGTTATC GGGCCCTGGT TTCCATGTGC GACCGCAATC TGGGACGTAT CCTTGATCTG 
ATGGATGAAC ACGATCTCTG GCGCGATACG ATGCTGATTG TCGGTACCGA TCACGGCTTC 
TTGCTGGGGG AGCACGGTTG GTGGGCTAAA AATCAAATGC CCTATTATAA CGAGGTGGCG 
AATAACCCGC TGTTTATCTG GGACCCGCGC AGCGCGGTAT GCGGAGCGCG ACGGCAGTCG 
CTGGTGCAGA TGATTGACTG GGCACCAACG CTACTGAATT ATTTTCAGCA ACCTATTCCC 
GCAGATATGC AGGGCCAACC GCTGGCGAAA GTCATTGCCA GTGATGAACC CGTCAGGGAA 
GGTGCGCTGT TTGGCGTGTT TAGCGGACAT GTTAATGTTA CCGACGGACG CTATGTTTAT 
ATGCGGGCCG CGCAGCCGGG GCGTGAGCAT GACATTGCGA ACTACACGTT AATGCCGATC 
AAGATGAATG CGCGTTATGA CGTGGATGAA CTGGGAAAAT TATCTCTGGC ACCTCCGTTT 
AAATTCACTA AAGGGCTTCA GGTATTACGT ATTCCGGCCA GGGAAAAATA TAAAGGTGTG 
AATAGCTTTG GTCATCTCTT GTTTGATCTC AGAGACGATC CGCAGCAGCA ACATCCTATT 
CATGATGAGG CCATCGAAGC AAGGATGATC AACTTACTTA TCCGTTTGAT GAAAGAAAAT 
GATGCTCCGG CGGAGCAGTA TCGCCGTCTG GGTCTGGATG TTGTCTAA

Protein sequence

MKAIILLFDS LNKNYLPPYG DLLTKAPNFQ RLAAHTATFD NSYVGSMPCM PARRELHTGR 
YNFLHREWGP LEPFDDSMPE LLKKAGIYTH LISDHLHYWE DGGGNYHNRY SSWDVVRGQE 
GDHWKASVGE PPIPEVLRVP QKQTGGGVSG LWRHDWANRE YIQQEADFPQ TKVFDAGCDF 
IHKNHAEDNW LLQVETFDPH EPFYTTEEYL SLYDDEWQGP HYDWPRGKVS ESEEAIAHIR 
CRYRALVSMC DRNLGRILDL MDEHDLWRDT MLIVGTDHGF LLGEHGWWAK NQMPYYNEVA 
NNPLFIWDPR SAVCGARRQS LVQMIDWAPT LLNYFQQPIP ADMQGQPLAK VIASDEPVRE 
GALFGVFSGH VNVTDGRYVY MRAAQPGREH DIANYTLMPI KMNARYDVDE LGKLSLAPPF 
KFTKGLQVLR IPAREKYKGV NSFGHLLFDL RDDPQQQHPI HDEAIEARMI NLLIRLMKEN 
DAPAEQYRRL GLDVV