Gene SeHA_C1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1020
Symbol
ID	6492400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	1003505
End bp	1004992
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	52%
IMG OID	642741262
Product	sulfatase
Protein accession	YP_002044915
Protein GI	194450888
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.30238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	105
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TTATTCTGCT GTTTGACAGT CTGAATAAAA ACTATTTGCC GCCCTATGGT 
GATTTGCTAA CGAAAGCGCC TAACTTTCAA CGCCTGGCGG CACATACCGC CACCTTTGAC 
AATAGTTATG TCGGCAGTAT GCCCTGTATG CCAGCCCGTC GGGAACTGCA CACCGGGCGC 
TACAACTTTC TGCATCGTGA GTGGGGGCCG CTGGAACCCT TTGATGATTC CATGCCGGAA 
TTATTGAAAA AAGCGGGGAT CTACACCCAT CTTATCAGCG ATCATCTGCA TTACTGGGAA 
GACGGCGGCG GTAACTACCA TAACCGCTAT AGCTCCTGGG ACGTAGTACG CGGTCAGGAG 
GGCGATCACT GGAAGGCAAG TGTTGGCGAG CCGCCCATTC CGGAAGTACT GCGCGTTCCA 
CAAAAACAAA CCGGAGGCGG CGTTTCCGGG CTATGGCGTC ATGACTGGGC GAACCGCGAA 
TACATCCAGC AGGAAGCCGA TTTTCCCCAG ACGAAAGTTT TTGACGCCGG GTGCGATTTT 
ATCCATAAAA ATCATGCCGA AGATAACTGG TTATTGCAGG TTGAGACGTT CGATCCGCAT 
GAGCCGTTTT ATACCACCGA GGAATATTTA TCGCTCTATG ACGATGAGTG GCAAGGTCCG 
CATTATGACT GGCCGCGCGG CAAAGTCAGT GAAAGTGAGG AGGCGATAGC GCATATTCGC 
TGTCGTTATC GGGCCCTGGT TTCCATGTGC GACCGCAATC TGGGACGTAT CCTTGATCTG 
ATGGATGAAC ACGATCTCTG GCGCGATACG ATGCTGATTG TCGGTACCGA TCACGGCTTC 
TTGCTGGGGG AGCACGGTTG GTGGGCTAAA AATCAAATGC CCTATTATAA CGAGGTGGCG 
AATAACCCGC TGTTTATCTG GGACCCGCGC AGCGCGGTAT GCGGAGCGCG ACGGCAGTCG 
CTGGTGCAGA TGATTGACTG GGCGCCAACG CTACTGGATT ATTTTCAGCA ACCTATTCCC 
GCAGATATGC AGGGCCAACC GCTGGCGAAA GTCATTGCCA GTGATGAACC CGTCAGGGAA 
GGCGCGCTGT TTGGCGTGTT TAGCGGACAT GTTAATGTTA CTGACGGACG CTATGTTTAT 
ATGCGGGCCG CGCAGCCGGG GCGTGAGCAT GACATTGCGA ACTACACGTT AATGCCGATC 
AAGATGAATG CGCGTTATGA CGTGGATGAA CTGGGAAAAT TATCTCTGGC GCCTCCGTTT 
AACTTTACTA AAGGGCTTCA GGTATTACGT ATTCCGGCCA GGGAAAAATA TAAAGGTGTA 
AATAGCTTTG GTCATCTCTT GTTTGATCTC AGAGACGATC CGCAGCAGCA ACATCCTATT 
CATGATGAGG CCATCGAGGC AAGGATGATC AGCTTACTTA TTCGTTTGAT GAAAGAAAAT 
GATGCTCCGG CGGAGCAGTA TCGCCGTCTG GGTCTGGATG TTATCTAA

Protein sequence

MKAIILLFDS LNKNYLPPYG DLLTKAPNFQ RLAAHTATFD NSYVGSMPCM PARRELHTGR 
YNFLHREWGP LEPFDDSMPE LLKKAGIYTH LISDHLHYWE DGGGNYHNRY SSWDVVRGQE 
GDHWKASVGE PPIPEVLRVP QKQTGGGVSG LWRHDWANRE YIQQEADFPQ TKVFDAGCDF 
IHKNHAEDNW LLQVETFDPH EPFYTTEEYL SLYDDEWQGP HYDWPRGKVS ESEEAIAHIR 
CRYRALVSMC DRNLGRILDL MDEHDLWRDT MLIVGTDHGF LLGEHGWWAK NQMPYYNEVA 
NNPLFIWDPR SAVCGARRQS LVQMIDWAPT LLDYFQQPIP ADMQGQPLAK VIASDEPVRE 
GALFGVFSGH VNVTDGRYVY MRAAQPGREH DIANYTLMPI KMNARYDVDE LGKLSLAPPF 
NFTKGLQVLR IPAREKYKGV NSFGHLLFDL RDDPQQQHPI HDEAIEARMI SLLIRLMKEN 
DAPAEQYRRL GLDVI