Gene EcolC_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3943
Symbol
ID	6064452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4327364
End bp	4329349
Gene Length	1986 bp
Protein Length	661 aa
Translation table	11
GC content	53%
IMG OID	641603356
Product	beta-lactamase domain-containing protein
Protein accession	YP_001726871
Protein GI	170021917
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2015] Alkyl sulfatase and related hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAACT CTCGGTTATT CCGTTTGAGC AGGATTGTTA TTGCGTTAAC TGCCGCCAGC 
GGCATGATGG TAAATACCGC TAACGCGAAA GAGGAAGCGA AAGCCGCCAC TCAATATACC 
CAACAGGTTA ATCAGAATTA CGCCAAATCA TTACCGTTTA GCGATCGTCA GGATTTTGAC 
GATGCCCAGC GTGGATTTAT CGCCCCGCTG CTGGATGAAG GTATTCTGCG TGATGCGAAC 
GGTAAAGTTT ACTACCGCGC GGACGATTAC AAATTTGATA TTAATGCCGC AGCGCCGGAA 
ACCGTAAACC CCAGCCTGTG GCGTCAGTCG CAAATCAACG GTATTTCTGG CCTGTTCAAA 
GTCACCGATA AAATGTATCA GGTGCGCGGC CAGGATATCT CTAACATTAC GTTCGTTGAG 
GGCGAGAAAG GCATTATTGT TATCGACCCG CTGGTGACGC CGCCTGCCGC AAAAGCCGCA 
CTTGACCTTT ACTTCCAGCA TCGTCCGCAA AAACCGATTG TTGCCGTTAT CTACACTCAC 
AGCCACACCG ACCACTATGG TGGCGTGAAA GGCATTATCT CTGAAGCCGA TGTTAAATCC 
GGCAAAGTTC AGGTGATTGC CCCTGCAGGC TTTATGGACG AAGCCATCAG CGAAAACGTG 
CTGGCGGGTA ACATCATGAG CCGCCGTGCG CTCTACTCTT ACGGTCTGTT ACTGCCGCAC 
AACGCGCAAG GCAACGTGGG TAATGGCCTT GGCGTGACGC TGGCAACGGG CGACCCGAGC 
ATTATTGCAC CGACTAAAAC TATCGTCCGA ACTGGCGAGA AGATGATTAT CGACGGCCTG 
GAGTTTGACT TCCTGATGAC CCCAGGTAGC GAAGCGCCAG CCGAAATGCA CTTCTATATT 
CCGGCCCTGA AAGCCCTGTG TACCGCCGAG AACGCCACGC ATACCCTGCA CAACTTCTAC 
ACTCTACGCG GCGCGAAAAC CCGCGACACC AGCAAGTGGA CCGAGTATCT GAACGAAACG 
CTGGATATGT GGGGTAACGA CGCGGAAGTC CTGTTTATGC CGCACACCTG GCCGGTCTGG 
GGCAATAAGC ATATCAATGA TTATATTGGT AAATATCGCG ATACTATCAA GTACATTCAC 
GACCAGACCC TGCACCTGGC GAACCAGGGC TACACCATGA ATGAAATCGG CGACATGATT 
AAGCTGCCGC CTGCACTTGC CAATAACTGG GCCAGCCGTG GCTATTACGG TTCTGTCAGC 
CACAACGCCC GCGCGGTGTA TAACTTCTAT CTTGGCTATT ACGACGGTAA CCCGGCTAAC 
CTGCATCCGT ATGGTCAGGT GGAGATGGGT AAACGTTACG TGCAGGCGCT GGGCGGTTCT 
GCCCGTGTCA TCAACCTGGC GCAAGAAGCG AACAAGCAAG GTGATTACCG CTGGTCGGCA 
GAACTGCTGA AACAGGTGAT TGCCGCCAAC CCGGGTGACC AGGTCGCGAA GAATCTGCAA 
GCGAATAACT TTGAACAGCT GGGCTATCAG GCCGAGTCCG CCACCTGGCG CGGTTTCTAC 
CTGACCGGCG CGAAAGAGCT GCGCGAAGGG GTGCATAAGT TCAGCCACGG CACCACCGGT 
TCCCCGGACA CCATTCGCGG GATGTCGGTC GAAATACTGT TCGACTTTAT GTCCGTTCGC 
CTCGATAGCG CGAAAGCCGC GGGTAAAAAT ATCAGCCTGA ACTTCAATAT GGGCAACGGC 
GATAACCTCA ACCTGACGCT GAACGATAGT GTGCTTAACT ACCGGAAAAC GCTGCAACCG 
CAAGCCAACG CCTCTTTCTA CATCAGCCGT GAAGATCTGC ACGCCGTGCT GACCGGACAG 
GCAAAAATGG CGGATCTGGT AAAAGCGAAG AAAGCCAAAA TTATTGGCAA TGGCGCGAAA 
CTGGAAGAAA TTATTGCCTG TCTGGATAAT TTCGATTTGT GGGTGAATAT CGTAACCCCA 
AATTAA

Protein sequence

MNNSRLFRLS RIVIALTAAS GMMVNTANAK EEAKAATQYT QQVNQNYAKS LPFSDRQDFD 
DAQRGFIAPL LDEGILRDAN GKVYYRADDY KFDINAAAPE TVNPSLWRQS QINGISGLFK 
VTDKMYQVRG QDISNITFVE GEKGIIVIDP LVTPPAAKAA LDLYFQHRPQ KPIVAVIYTH 
SHTDHYGGVK GIISEADVKS GKVQVIAPAG FMDEAISENV LAGNIMSRRA LYSYGLLLPH 
NAQGNVGNGL GVTLATGDPS IIAPTKTIVR TGEKMIIDGL EFDFLMTPGS EAPAEMHFYI 
PALKALCTAE NATHTLHNFY TLRGAKTRDT SKWTEYLNET LDMWGNDAEV LFMPHTWPVW 
GNKHINDYIG KYRDTIKYIH DQTLHLANQG YTMNEIGDMI KLPPALANNW ASRGYYGSVS 
HNARAVYNFY LGYYDGNPAN LHPYGQVEMG KRYVQALGGS ARVINLAQEA NKQGDYRWSA 
ELLKQVIAAN PGDQVAKNLQ ANNFEQLGYQ AESATWRGFY LTGAKELREG VHKFSHGTTG 
SPDTIRGMSV EILFDFMSVR LDSAKAAGKN ISLNFNMGNG DNLNLTLNDS VLNYRKTLQP 
QANASFYISR EDLHAVLTGQ AKMADLVKAK KAKIIGNGAK LEEIIACLDN FDLWVNIVTP 
N