Gene ECD_03955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03955
Symbol	yjcS
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4211799
End bp	4213784
Gene Length	1986 bp
Protein Length	661 aa
Translation table	11
GC content	53%
IMG OID
Product	predicted alkyl sulfatase
Protein accession	ACT45745
Protein GI	253980075
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.587237
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAACT CTCGGTTATT CCGTTTGAGC AGGATTGTTA TTGCGTTAAC TGCCGCCAGC 
GGCATGATGG TAAATACCGC TAACGCGAAA GAGGAAGCGA AAGCCGCCAC TCAATATACC 
CAACAGGTTA ATCAGAATTA CGCCAAATCA TTACCGTTTA GCGATCGTCA GGATTTTGAC 
GATGCCCAGC GTGGATTTAT CGCCCCGCTG CTGGATGAAG GTATTCTGCG TGATGCGAAC 
GGTAAAGTTT ACTACCGCGC GGACGATTAC AAATTTGATA TTAATGCCGC AGCGCCGGAA 
ACCGTAAACC CCAGCCTGTG GCGTCAGTCG CAAATCAACG GTATTTCTGG CCTGTTCAAA 
GTCACCGATA AAATGTATCA GGTGCGCGGC CAGGATATCT CTAACATTAC GTTCGTTGAG 
GGCGAGAAAG GCATTATTGT TATCGACCCG CTGGTGACGC CGCCTGCCGC AAAAGCCGCA 
CTTGACCTTT ACTTCCAGCA TCGTCCGCAA AAACCGATTG TTGCCGTTAT CTACACTCAC 
AGCCACACCG ACCACTATGG TGGCGTGAAA GGCATTATCT CTGAAGTCGA TGTTAAATCC 
GGCAAAGTTC AGGTGATTGC CCCTGCAGGC TTTATGGACG AAGCCATCAG CGAAAACGTG 
CTGGCGGGTA ACATCATGAG CCGCCGTGCG CTCTACTCTT ACGGTCTGTT ACTGCCGCAC 
AACGCGCAAG GCAACGTGGG TAATGGCCTT GGCGTGACGC TGGCAACGGG CGACCCGAGC 
ATTATTGCAC CGACTAAAAC TATCGTCCGA ACTGGCGAGA AGATGATTAT CGACGGCCTG 
GAGTTTGACT TCCTGATGAC CCCAGGTAGC GAAGCGCCAG CCGAAATGCA CTTCTATATT 
CCGGCCCTGA AAGCCCTGTG TACCGCCGAG AACGCCACGC ATACCCTGCA CAACTTCTAC 
ACTCTACGCG GCGCGAAAAC CCGCGACACC AGCAAGTGGA CCGAGTATCT GAACGAAACG 
CTGGATATGT GGGGTAACGA CGCGGAAGTC CTGTTTATGC CGCACACCTG GCCGGTCTGG 
GGCAATAAGC ATATCAATGA TTATATTGGT AAATATCGCG ATACTATCAA GTACATTCAC 
GACCAGACCC TGCACCTGGC GAACCAGGGC TACACCATGA ATGAAATCGG CGACATGATT 
AAGCTGCCGC CTGCACTTGC CAATAACTGG GCCAGCCGTG GCTATTACGG TTCTGTCAGC 
CACAACGCCC GCGCGGTGTA TAACTTCTAT CTTGGCTATT ACGACGGTAA CCCGGCTAAC 
CTGCATCCGT ATGGTCAGGT GGAGATGGGT AAACGTTACG TGCAGGCGCT GGGCGGTTCT 
GCCCGTGTCA TCAACCTGGC GCAAGAAGCG AACAAGCAAG GTGATTACCG CTGGTCGGCA 
GAACTGCTGA AACAGGTGAT TGCCGCCAAC CCGGGTGACC AGGTCGCGAA GAATCTGCAA 
GCGAATAACT TTGAACAGCT GGGCTATCAG GCCGAGTCCG CCACCTGGCG CGGTTTCTAC 
CTGACCGGCG CGAAAGAGCT GCGCGAAGGG GTGCATAAGT TCAGCCACGG CACCACCGGT 
TCCCCGGACA CCATTCGCGG GATGTCGGTC GAAATGCTGT TCGACTTTAT GTCCGTTCGC 
CTCGATAGCG CGAAAGCCGC GGGTAAAAAT ATCAGCCTGA ACTTCAATAT GGGCAACGGC 
GATAACCTCA ACCTGACGCT GAACGATAGT GTGCTTAACT ACCGGAAAAC GCTGCAACCG 
CAAGCCAACG CATCTTTCTA CATCAGCCGT GAAGATCTGC ACGCCGTGCT GACCGGACAG 
GCAAAAATGG CGGATCTGGT AAAAGCGAAG AAAGCCAAAA TTATTGGCAA TGGCGCGAAA 
CTGGAAGAAA TTATTGCCTG TCTGGATAAT TTCGATTTGT GGGTGAATAT CGTAACCCCA 
AATTAA

Protein sequence

MNNSRLFRLS RIVIALTAAS GMMVNTANAK EEAKAATQYT QQVNQNYAKS LPFSDRQDFD 
DAQRGFIAPL LDEGILRDAN GKVYYRADDY KFDINAAAPE TVNPSLWRQS QINGISGLFK 
VTDKMYQVRG QDISNITFVE GEKGIIVIDP LVTPPAAKAA LDLYFQHRPQ KPIVAVIYTH 
SHTDHYGGVK GIISEVDVKS GKVQVIAPAG FMDEAISENV LAGNIMSRRA LYSYGLLLPH 
NAQGNVGNGL GVTLATGDPS IIAPTKTIVR TGEKMIIDGL EFDFLMTPGS EAPAEMHFYI 
PALKALCTAE NATHTLHNFY TLRGAKTRDT SKWTEYLNET LDMWGNDAEV LFMPHTWPVW 
GNKHINDYIG KYRDTIKYIH DQTLHLANQG YTMNEIGDMI KLPPALANNW ASRGYYGSVS 
HNARAVYNFY LGYYDGNPAN LHPYGQVEMG KRYVQALGGS ARVINLAQEA NKQGDYRWSA 
ELLKQVIAAN PGDQVAKNLQ ANNFEQLGYQ AESATWRGFY LTGAKELREG VHKFSHGTTG 
SPDTIRGMSV EMLFDFMSVR LDSAKAAGKN ISLNFNMGNG DNLNLTLNDS VLNYRKTLQP 
QANASFYISR EDLHAVLTGQ AKMADLVKAK KAKIIGNGAK LEEIIACLDN FDLWVNIVTP 
N