Gene B21_03624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03624
Symbol	aslB
ID	8114920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3871275
End bp	3872510
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	51%
IMG OID	644849788
Product	hypothetical protein
Protein accession	YP_003001361
Protein GI	251787057
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00100971
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCAAC AGGTTCCAAC GCGTGCTTTT CATGTGATGG CGAAACCGAG CGGTTCCGAT 
TGTAATCTGA ACTGTGACTA CTGTTTTTAT CTCGAAAAAC AATCCCTTTA CCGCGAAAAG 
CCAGTCACGC ATATGGACGA TGACACGCTG GAAGCGTATG TCCGTCACTA TATCGCTGCC 
AGCGAAACCC AAAACGAAGT GGCTTTTACC TGGCAGGGCG GCGAACCAAC GTTACTCGGG 
CTGGATTTTT ACCGCCGTGC CGTGGCGCTA CAGGCGAAAT ATGGTGCTGA CAGGAAGATA 
AGTAACAGCT TCCAGACTAA TGGCGTGCTG CTTGATGACG AATGGTGTGC ATTTCTGGCA 
GAAAATCATT TTCTTGTTGG GTTATCGCTG GATGGTCCGG CTGAGATCCA CAATCAATAT 
CGCGTGACCA AAGGCGGCAG ACCAACGCAT AAGCTGGTGA TGCGTGCCCT GACGCTCCTG 
CAAAAACATC ATGTCGACTA TAACGTGCTG GTCTGCGTAA ATCGCACCAG TGCGTTACAA 
CCTTTGCAAG TCTATGATTT TCTGTGTGAT GCAGGCGTTG AGTTTATCCA GTTTATTCCT 
GTGGTCGAAC GCCTGGCTGA TGAAACGGCT GTTCATGCTG GACTTAAGCT ACATGCTCCC 
GGCGATATTC AGGGCGAACT GACGGAATGG TCGGTACGCC CCGAGGAGTT CGGTGAATTT 
TTGGTGGCGA TATTCGACCA CTGGATCAAA CGCGACGTCG GCAAGATTTT CGTGATGAAT 
ATCGAATGGG CGTTTGCCAA TTTTGTCGGT GCGCCAGGAG CGGTTTGCCA TCATCAGCCA 
ACCTGTGGGC GCTCGGTGAT TGTTGAACAC AACGGCGACG TTTACGCCTG CGATCACTAT 
GTTTATCCGC AATATCGACT GGGGAATATG CTTCAGCAGA CAATTGCAGA AATGGTAGAT 
TCCCCGCAAC AGCAGGTGTT TGGTGAAGAT AAATTTAAGC AGTTACCGGC GCAGTGTCGC 
AGTTGCAACG TGTTAAAAGC GTGCTGGGGA GGCTGTCCGA AACACCGCTT TATGCTCGAT 
GCCAGCGGTA AACCGGGGCT GAATTATTTG TGTGCCGGGT ATCAGCGTTA TTTCCGCCAT 
CTACCGCCAT ATCTTAAAGC AATGGCTGAT TTGCTGGCGC ACGGTCGTCC GGCCAGCGAC 
ATTATGCAGG CGCATTTGAT GGTGGTGAAT AAGTAG

Protein sequence

MLQQVPTRAF HVMAKPSGSD CNLNCDYCFY LEKQSLYREK PVTHMDDDTL EAYVRHYIAA 
SETQNEVAFT WQGGEPTLLG LDFYRRAVAL QAKYGADRKI SNSFQTNGVL LDDEWCAFLA 
ENHFLVGLSL DGPAEIHNQY RVTKGGRPTH KLVMRALTLL QKHHVDYNVL VCVNRTSALQ 
PLQVYDFLCD AGVEFIQFIP VVERLADETA VHAGLKLHAP GDIQGELTEW SVRPEEFGEF 
LVAIFDHWIK RDVGKIFVMN IEWAFANFVG APGAVCHHQP TCGRSVIVEH NGDVYACDHY 
VYPQYRLGNM LQQTIAEMVD SPQQQVFGED KFKQLPAQCR SCNVLKACWG GCPKHRFMLD 
ASGKPGLNYL CAGYQRYFRH LPPYLKAMAD LLAHGRPASD IMQAHLMVVN K