Gene B21_03625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03625
Symbol	aslA
ID	8113561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3872668
End bp	3874323
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	53%
IMG OID	644849789
Product	hypothetical protein
Protein accession	YP_003001362
Protein GI	251787058
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.173568
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTTT CGTTTTCACC CAAACTTCTT GTTGTAGCTG TCGCCGCCGC TCTTCCACTC 
ATGGCCAACG CAGCAGATAC CCCGTCAACC GCCACCGCAC GCAAAGGCTT TGCCGGATAC 
GATCACCCAA ACCAGTATCT GGTTAAACCG GCGACCACTA TTGCCGACAA CATGATGCCG 
GTGATGCAGC ATCCTGCACA AGACAAAGAA ACCCAGCAGA AGCTGGCAGA ACTTGAGAAA 
AAAACCGGTA AGAAACCGAA CGTGGTTGTT TTCTTGCTGG ATGATGTGGG CTGGATGGAT 
GTTGGCTTTA ACGGCGGCGG CGTGGCGGTG GGTAACCCTA CACCAGATAT CGACGCCGTT 
GCCAGCCAGG GGCTGATTTT AACTTCGGCG TATTCTCAAC CGAGTTCTTC CCCAACCCGC 
GCCACGATTC TTACCGGACA ATACTCCATC CACCACGGCA TTCTGATGCC GCCAATGTAC 
GGGCAACCGG GCGGTCTGCA AGGGTTAACC ACTCTGCCGC AGTTGCTGCA CGATCAGGGC 
TACGTCACTC AGGCCATCGG GAAATGGCAT ATGGGGGAAA ACAAAGAGTC GCAGCCGCAG 
AACGTTGGCT TTGATGATTT CCGCGGCTTT AACTCGGTAT CCGATATGTA TACCGAATGG 
CGTGATGTTC ACGTCAACCC GGAAGTCGCC CTGAGCCCGG ATCGTTCTGA ATACATCCAA 
AAACTGCCGT TCAGCAAAGA TGACGTTCAT GCCGTGCGCG GCGGTGAACA GGAAGCCATT 
GCCGACATTA CGCCGAAATA TATGGAAGAC CTGGATCAAC GCTGGATGGA ATATGGCGTT 
AAGTTCCTCG ACAAGATGGC GAAGAGCGAT AAGCCTTTCT TCCTCTACTA CGGCACTCGC 
GGCTGTCACT TCGATAACTA CCCAAATGCG AAATATGCGG GTAGCTCTCC GGCGCGCACC 
TCTTACGGCG ACTGCATGGT GGAGATGAAC GATATCTTCG CCAATCTGTA TAAAGCACTG 
GAGAAAAACG GTCAGCTTGA TAACACGCTG ATTGTGTTCA CCTCTGATAA CGGTCCGGAA 
GCCGAAGTTC CGCCGCACGG TCGCACGCCG TTCCGCGGTG CGAAAGGTTC TACATGGGAA 
GGCGGCGTTC GTGTGCCAAC CTTCGTTTAC TGGAAAGGCA TGATCCAACC GCGTAAATCT 
GACGGCATTG TCGATCTGGC GGATCTCTTC CCTACGGCGC TGGATCTGGC GGGGCATCCT 
GGGGCGAAAG TAGCGAATTT AGTACCGAAA ACCACCTTTA TCGATGGTGT GGACCAGACA 
TCTTTCTTCC TGGGAACAAA TGGTCAGTCT AACCGTAAGG CCGAGCACTA CTTCCTCAAC 
GGTAAACTTT CTGCTGTGCG TATGGATGAG TTCAAGTATC ACGTCCTGAT CCAGCAACCG 
TACGCGTATA CCCAGAGCGG GTATCAGGGT GGATTCACCG GCACAGTAAT GCAAACGGCG 
GGATCGTCGG TGTTTAACCT GTACACCGAT CCGCAGGAAA GCGACTCCAT CGGCGTGCGC 
CATATTCCGA TGGGTGTACC GCTACAGACC GAAATGCACG CGTATATGGA GATCCTGAAA 
AAATATCCAC CACGCGCGCA GATTAAATCT GACTAA

Protein sequence

MEFSFSPKLL VVAVAAALPL MANAADTPST ATARKGFAGY DHPNQYLVKP ATTIADNMMP 
VMQHPAQDKE TQQKLAELEK KTGKKPNVVV FLLDDVGWMD VGFNGGGVAV GNPTPDIDAV 
ASQGLILTSA YSQPSSSPTR ATILTGQYSI HHGILMPPMY GQPGGLQGLT TLPQLLHDQG 
YVTQAIGKWH MGENKESQPQ NVGFDDFRGF NSVSDMYTEW RDVHVNPEVA LSPDRSEYIQ 
KLPFSKDDVH AVRGGEQEAI ADITPKYMED LDQRWMEYGV KFLDKMAKSD KPFFLYYGTR 
GCHFDNYPNA KYAGSSPART SYGDCMVEMN DIFANLYKAL EKNGQLDNTL IVFTSDNGPE 
AEVPPHGRTP FRGAKGSTWE GGVRVPTFVY WKGMIQPRKS DGIVDLADLF PTALDLAGHP 
GAKVANLVPK TTFIDGVDQT SFFLGTNGQS NRKAEHYFLN GKLSAVRMDE FKYHVLIQQP 
YAYTQSGYQG GFTGTVMQTA GSSVFNLYTD PQESDSIGVR HIPMGVPLQT EMHAYMEILK 
KYPPRAQIKS D