Gene EcHS_A4019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4019
Symbol	aslB
ID	5591734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4011371
End bp	4012606
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	52%
IMG OID	640923123
Product	arylsulfatase-activating protein AslB
Protein accession	YP_001460590
Protein GI	157163272
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000000000197695
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCAAC AGGTTCCAAC GCGTGCTTTT CATGTGATGG CGAAACCGAG TGGTTCCGAT 
TGTAATCTGA ACTGTGACTA CTGTTTTTAT CTCGAAAAAC AATCCCTTTA CCGCGAAAAG 
CCAGTCACGC ATATGGACGA TGACACGCTG GAAGCGTATA TCCGTCACTA TATCGCCGCC 
AGCGAACTGC AAAACGAAGT GGCTTTTACC TGGCAGGGCG GCGAACCAAC GCTACTCGGG 
CTGGAGTTTT ACCGCCGTGC CGTAGCGCTA CAGGCGAAAT ATGGTGCTGG CAGGAAGATA 
AGTAACAGCT TCCAGACTAA CGGCGTGCTG CTGGATGACG AATGGTGCGC GTTTCTCGCG 
GAGCATCATT TTCTTGTTGG TTTATCGCTG GATGGTCCGC CTGAGATCCA CAATCAATAT 
CGCGTGACTA AAGGTGGCAG ACCCACGCAT AAGCTGGTGA TGCGTGCCCT GACGCTGCTG 
CAAAAACATC ATGTCGACTA TAACGTGCTG GTCTGCGTTA ATCGCACCAG CGCGCAGCAA 
CCGTTGCAGG TATATGATTT TTTGTGCGAT GCGGGAGTGG AATTCATCCA GTTTATTCCG 
GTGGTCGAGC GCCTGGCTGA TGAAACGGCT GCCCGCGAAG GACTGAAATT GCATGCGCCT 
GGTGATATTC AGGGTGAGCT AACGGAATGG TCGGTGCGCC CCGAGGAGTT CGGTGAATTT 
CTGGTGGCGA TATTCGACCA CTGGATCAAA CGCGACGTCG GCAAGATTTT CGTGATGAAT 
ATCGAATGGG CGTTTGCCAA TTTTGTCGGT GCGCCGGGTG CGGTTTGCCA TCATCAGCCA 
ACCTGTGGGC GCTCGGTGAT TGTTGAGCAC AACGGCGACG TTTACGCCTG CGATCACTAT 
GTTTATCCAC AATATCGGCT GGGGAATATG CACCAGCAAA CAATTGCAGA AATGATCGAT 
TCCCCGCAAC AGCAGGTGTT TGGTGAAGAT AAATTTAAGC AATTACCGGC GCAGTGTCGC 
AGTTGTAACG TGTTAAAAGC GTGCTGGGGA GGCTGCCCGA AACACCGCTT CATGCTCGAT 
GCCAGCGGCA AACCGGGGCT GAATTATTTG TGTGCCGGGT ATCAGCGTTA TTTCCGCCAT 
CTACCGCCAT ATCTTAAAGC AATGGCTGAT TTGCTGGCGC ACGGTCGCCC GGCCAGTGAC 
ATTATGCATG CGCATTTGCT GGTGGTGAGT AAGTAA

Protein sequence

MLQQVPTRAF HVMAKPSGSD CNLNCDYCFY LEKQSLYREK PVTHMDDDTL EAYIRHYIAA 
SELQNEVAFT WQGGEPTLLG LEFYRRAVAL QAKYGAGRKI SNSFQTNGVL LDDEWCAFLA 
EHHFLVGLSL DGPPEIHNQY RVTKGGRPTH KLVMRALTLL QKHHVDYNVL VCVNRTSAQQ 
PLQVYDFLCD AGVEFIQFIP VVERLADETA AREGLKLHAP GDIQGELTEW SVRPEEFGEF 
LVAIFDHWIK RDVGKIFVMN IEWAFANFVG APGAVCHHQP TCGRSVIVEH NGDVYACDHY 
VYPQYRLGNM HQQTIAEMID SPQQQVFGED KFKQLPAQCR SCNVLKACWG GCPKHRFMLD 
ASGKPGLNYL CAGYQRYFRH LPPYLKAMAD LLAHGRPASD IMHAHLLVVS K