Gene ECH74115_5236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5236
Symbol	aslB
ID	6972341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4879686
End bp	4880921
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	52%
IMG OID	643388901
Product	arylsulfatase-activating protein AslB
Protein accession	YP_002273315
Protein GI	209399680
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000331519
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAAC AGGTTCCAAC GCGTGCTTTT CATGTGATGG CGAAACCGAG CGGTTCCGAT 
TGTAATCTGA ACTGTGACTA CTGTTTTTAT CTCGAAAAAC AATCCCTTTA CCGCGAAAAG 
CCAGTCACGC ATATGGACGA TGACACGCTG GAAGCGTATG TCCGTCACTA TATCGCTGCC 
AGCGAACCGC AAAACGAAGT GGCTTTTACC TGGCAGGGCG GCGAACCAAC GCTACTCGGG 
CTGGAGTTTT ACCGCCGTGC CGTGGCGCTA CAGGCGAAAT ATGGTGCTGG CAGGAAGATA 
AGTAACAGCT TCCAGACTAA CGGCGTACTG CTCGATGATG AATGGTGTGC ATTTCTGGCA 
GAAAATCATT TTCTTGTTGG GTTATCGCTG GATGGTCCGG CTGAGATCCA CAATCAATAT 
CGCGTGACAA AAGGCGGCAG ACCCACGCAT AAACTGGTGA TGCGTGCCCT GACGCTCCTG 
CAAAAACATC ATGTCGACTA TAACGTGCTG GTCTGCGTCA ACCGCACCAG CGCGCAGCAA 
CCGTTACAGG TTTATGATTT TTTGTGCGAT GCGGGAGTCG AATTCATCCA GTTTATTCCG 
GTGGTCGAGC GCCTGGCTGA TGAAACGACT GCCCGCGAAG GACTGAAACT ACATGCGCCT 
GGTGATATTC AGGGGGAACT GACGGAATGG TCTGTGCGCC CCGATGAATT TGGTGAATTT 
CTGGTGGCGA TATTCGACCA CTGGATTAAA CGCGACGTCG GCAAGATTTT CGTGATGAAT 
ATCGAATGGG CGTTTGCCAA TTTTGTCGGT GCGCCGGGTG CGGTTTGCCA TCATCAGCCA 
ACCTGTGGGC GCTCGGTGAT TGTTGAGCAC AATGGCGACG TTTACGCCTG CGATCACTAT 
GTTTATCCGC AATATCGACT GGGGAATATG CACCAGCAAA CAATTGCAGA AATGATCGAT 
TCCCCGCAAC AGCAGGTGTT TGGTGAAGAT AAATTTAAGC AATTACCGGC GCAGTGTCGC 
AGTTGTAACG TGTTAAAAGC ATGTTGGGGA GGCTGCCCGA AACACCGCTT CATGCTCGAT 
GCCAGCGGCA AACCGGGACT GAATTATTTG TGTGCCGGGT ATCAGCGTTA TTTCCGCCAT 
CTACCGCCAT ATCTTAAAGC AATGGCTGAT TTGCTGGCGC ACGGTCGCCC GGCCAGCGAC 
ATTATGCAGG CGCATTTGCT GGTGGTGAGT AAGTAA

Protein sequence

MLQQVPTRAF HVMAKPSGSD CNLNCDYCFY LEKQSLYREK PVTHMDDDTL EAYVRHYIAA 
SEPQNEVAFT WQGGEPTLLG LEFYRRAVAL QAKYGAGRKI SNSFQTNGVL LDDEWCAFLA 
ENHFLVGLSL DGPAEIHNQY RVTKGGRPTH KLVMRALTLL QKHHVDYNVL VCVNRTSAQQ 
PLQVYDFLCD AGVEFIQFIP VVERLADETT AREGLKLHAP GDIQGELTEW SVRPDEFGEF 
LVAIFDHWIK RDVGKIFVMN IEWAFANFVG APGAVCHHQP TCGRSVIVEH NGDVYACDHY 
VYPQYRLGNM HQQTIAEMID SPQQQVFGED KFKQLPAQCR SCNVLKACWG GCPKHRFMLD 
ASGKPGLNYL CAGYQRYFRH LPPYLKAMAD LLAHGRPASD IMQAHLLVVS K