Gene ECD_03676 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03676
Symbol	aslA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	3874591
End bp	3876246
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	53%
IMG OID
Product	acrylsulfatase-like enzyme
Protein accession	ACT45469
Protein GI	253979799
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.176732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTTT CGTTTTCACC CAAACTTCTT GTTGTAGCTG TCGCCGCCGC TCTTCCACTC 
ATGGCCAACG CAGCAGATAC CCCGTCAACC GCCACCGCAC GCAAAGGCTT TGCCGGATAC 
GATCACCCAA ACCAGTATCT GGTTAAACCG GCGACCACTA TTGCCGACAA CATGATGCCG 
GTGATGCAGC ATCCTGCACA AGACAAAGAA ACCCAGCAGA AGCTGGCAGA ACTTGAGAAA 
AAAACCGGTA AGAAACCGAA CGTGGTTGTT TTCTTGCTGG ATGATGTGGG CTGGATGGAT 
GTTGGCTTTA ACGGCGGCGG CGTGGCGGTG GGTAACCCTA CACCAGATAT CGACGCCGTT 
GCCAGCCAGG GGCTGATTTT AACTTCGGCG TATTCTCAAC CGAGTTCTTC CCCAACCCGC 
GCCACGATTC TTACCGGACA ATACTCCATC CACCACGGCA TTCTGATGCC GCCAATGTAC 
GGGCAACCGG GCGGTCTGCA AGGGTTAACC ACTCTGCCGC AGTTGCTGCA CGATCAGGGC 
TACGTCACTC AGGCCATCGG GAAATGGCAT ATGGGGGAAA ACAAAGAGTC GCAGCCGCAG 
AACGTTGGCT TTGATGATTT CCGCGGCTTT AACTCGGTAT CCGATATGTA TACCGAATGG 
CGTGATGTTC ACGTCAACCC GGAAGTCGCC CTGAGCCCGG ATCGTTCTGA ATACATCCAA 
AAACTGCCGT TCAGCAAAGA TGACGTTCAT GCCGTGCGCG GCGGTGAACA GGAAGCCATT 
GCCGACATTA CGCCGAAATA TATGGAAGAC CTGGATCAAC GCTGGATGGA ATATGGCGTT 
AAGTTCCTCG ACAAGATGGC GAAGAGCGAT AAGCCTTTCT TCCTCTACTA CGGCACTCGC 
GGCTGTCACT TCGATAACTA CCCAAATGCG AAATATGCGG GTAGCTCTCC GGCGCGCACC 
TCTTACGGCG ACTGCATGGT GGAGATGAAC GATATCTTCG CCAATCTGTA TAAAGCACTG 
GAGAAAAACG GTCAGCTTGA TAACACGCTG ATTGTGTTCA CCTCTGATAA CGGTCCGGAA 
GCCGAAGTTC CGCCGCACGG TCGCACGCCG TTCCGCGGTG CGAAAGGTTC TACATGGGAA 
GGCGGCGTTC GTGTGCCAAC CTTCGTTTAC TGGAAAGGCA TGATCCAACC GCGTAAATCT 
GACGGCATTG TCGATCTGGC GGATCTCTTC CCTACGGCGC TGGATCTGGC GGGGCATCCT 
GGGGCGAAAG TAGCGAATTT AGTACCGAAA ACCACCTTTA TCGATGGTGT GGACCAGACA 
TCTTTCTTCC TGGGAACAAA TGGTCAGTCT AACCGTAAGG CCGAGCACTA CTTCCTCAAC 
GGTAAACTTT CTGCTGTGCG TATGGATGAG TTCAAGTATC ACGTCCTGAT CCAGCAACCG 
TACGCGTATA CCCAGAGCGG GTATCAGGGT GGATTCACCG GCACAGTAAT GCAAACGGCG 
GGATCGTCGG TGTTTAACCT GTACACCGAT CCGCAGGAAA GCGACTCCAT CGGCGTGCGC 
CATATTCCGA TGGGTGTACC GCTACAGACC GAAATGCACG CGTATATGGA GATCCTGAAA 
AAATATCCAC CACGCGCGCA GATTAAATCT GACTAA

Protein sequence

MEFSFSPKLL VVAVAAALPL MANAADTPST ATARKGFAGY DHPNQYLVKP ATTIADNMMP 
VMQHPAQDKE TQQKLAELEK KTGKKPNVVV FLLDDVGWMD VGFNGGGVAV GNPTPDIDAV 
ASQGLILTSA YSQPSSSPTR ATILTGQYSI HHGILMPPMY GQPGGLQGLT TLPQLLHDQG 
YVTQAIGKWH MGENKESQPQ NVGFDDFRGF NSVSDMYTEW RDVHVNPEVA LSPDRSEYIQ 
KLPFSKDDVH AVRGGEQEAI ADITPKYMED LDQRWMEYGV KFLDKMAKSD KPFFLYYGTR 
GCHFDNYPNA KYAGSSPART SYGDCMVEMN DIFANLYKAL EKNGQLDNTL IVFTSDNGPE 
AEVPPHGRTP FRGAKGSTWE GGVRVPTFVY WKGMIQPRKS DGIVDLADLF PTALDLAGHP 
GAKVANLVPK TTFIDGVDQT SFFLGTNGQS NRKAEHYFLN GKLSAVRMDE FKYHVLIQQP 
YAYTQSGYQG GFTGTVMQTA GSSVFNLYTD PQESDSIGVR HIPMGVPLQT EMHAYMEILK 
KYPPRAQIKS D