Gene EcSMS35_4166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4166
Symbol	aslA
ID	6146022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4263998
End bp	4265653
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	53%
IMG OID	641618989
Product	arylsulfatase
Protein accession	YP_001746117
Protein GI	170681296
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00523411
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTTT CGTTTTCACC CAAACTTCTT GTTGTAGCTG TCGCCGCCGC TCTTCCACTC 
ATGGCCAACG CAGCAGATAC CCCGTCAACC GCCACCGCAC GCAAAGGCTT TGCCGGATAC 
GATCACCCAA ACCAGTATCT GGTTAAACCG GCGACCACTA TTGCCGACAA CATGATGCCG 
GTGATGCAGC ATCCTGCACA AGACAAAGAA ACCCAGCAGA AGCTGGCAGA ACTTGAGAAA 
AAAACCGGTA AGAAACCGAA CGTGGTTGTT TTCTTGCTGG ATGATGTGGG CTGGATGGAT 
GTTGGCTTTA ACGGCGGCGG CGTGGCGGTG GGTAACCCTA CACCAGATAT CGACGCCGTT 
GCCAGCCAGG GGCTGATTTT AACTTCGGCG TATTCTCAAC CGAGTTCTTC CCCAACCCGC 
GCCACGATTC TTACCGGACA ATACTCCATC CACCACGGCA TTCTGATGCC GCCAATGTAC 
GGGCAACCGG GCGGTCTGCA AGGGTTAACC ACTCTGCCGC AGTTGCTGCA CGATCAGGGC 
TACGTCACTC AGGCCATCGG GAAATGGCAT ATGGGGGAAA ACAAAGAGTC GCAGCCGCAG 
AACGTTGGCT TTGATGATTT CCGCGGCTTT AACTCGGTAT CCGATATGTA TACCGAATGG 
CGTGATGTTC ACGTCAACCC GGAAGTCGCC CTGAGCCCGG ATCGTTCTGA ATACATCCAA 
AAACTGCCGT TCAGCAAAGA TGACGTTCAT GCCGTGCGCG GCGGTGAACA GGAAGCCATT 
GCCGACATTA CGCCGAAATA TATGGAAGAC CTGGATCAAC GCTGGATGGA ATATGGCGTT 
AAGTTCCTCG ACAAGATGGC GAAGAGCGAT AAGCCTTTCT TCCTCTACTA CGGCACTCGC 
GGCTGTCACT TCGATAACTA CCCAAATGCG AAATATGCGG GTAGCTCTCC GGCGCGCACC 
TCTTACGGCG ACTGCATGGT GGAGATGAAC GATATCTTCG CCAATCTGTA TAAAGCACTG 
GAGAAAAACG GTCAGCTTGA TAACACGCTG ATTGTGTTCA CCTCTGATAA CGGTCCGGAA 
GCCGAAGTTC CGCCGCACGG TCGCACGCCG TTCCGCGGTG CGAAAGGTTC TACATGGGAA 
GGCGGCGTTC GTGTGCCAAC CTTCGTTTAC TGGAAAGGCA TGATCCAACC GCGTAAATCT 
GACGGCATTG TCGATCTGGC GGATCTCTTC CCTACGGCGC TGGATCTGGC GGGGCATCCT 
GGGGCGAAGG TAGCGAATTT AGTACCGAAA ACCACCTTTA TCGATGGTGT GGACCAGACA 
TCTTTCTTCC TGGGAACAAA TGGTCAGTCT AACCGTAAGG CCGAGCACTA CTTCCTCAAC 
GGTAAACTTT CTGCTGTGCG TATGGATGAG TTCAAGTATC ACGTCCTGAT CCAGCAACCG 
TACGCGTATA CCCAGAGCGG GTATCAGGGT GGATTCACCG GCACAGTAAT GCAAACGGCG 
GGATCGTCGG TGTTTAACCT GTACACCGAT CCGCAGGAAA GCGACTCCAT CGGCGTGCGC 
CATATTCCGA TGGGTGTACC GCTACAGACC GAAATGCACG CGTATATGGA GATCCTGAAA 
AAATATCCAC CACGCGCGCA GATTAAATCT GACTAA

Protein sequence

MEFSFSPKLL VVAVAAALPL MANAADTPST ATARKGFAGY DHPNQYLVKP ATTIADNMMP 
VMQHPAQDKE TQQKLAELEK KTGKKPNVVV FLLDDVGWMD VGFNGGGVAV GNPTPDIDAV 
ASQGLILTSA YSQPSSSPTR ATILTGQYSI HHGILMPPMY GQPGGLQGLT TLPQLLHDQG 
YVTQAIGKWH MGENKESQPQ NVGFDDFRGF NSVSDMYTEW RDVHVNPEVA LSPDRSEYIQ 
KLPFSKDDVH AVRGGEQEAI ADITPKYMED LDQRWMEYGV KFLDKMAKSD KPFFLYYGTR 
GCHFDNYPNA KYAGSSPART SYGDCMVEMN DIFANLYKAL EKNGQLDNTL IVFTSDNGPE 
AEVPPHGRTP FRGAKGSTWE GGVRVPTFVY WKGMIQPRKS DGIVDLADLF PTALDLAGHP 
GAKVANLVPK TTFIDGVDQT SFFLGTNGQS NRKAEHYFLN GKLSAVRMDE FKYHVLIQQP 
YAYTQSGYQG GFTGTVMQTA GSSVFNLYTD PQESDSIGVR HIPMGVPLQT EMHAYMEILK 
KYPPRAQIKS D