Gene EcolC_0526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0526
Symbol
ID	6064545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	566747
End bp	568372
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	43%
IMG OID	641599932
Product	sulfatase
Protein accession	YP_001723530
Protein GI	170018576
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000512477
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAGTAT TCAACAAATT TGCTAGAAGT TTTAAATCTC ATTGGTTGTT GTATCTTTGT 
GTTATTGTTT TTGGTATTAC GAACTTAGTC GCCTCTTCCG GCGCGCATAT GGTTCAGCGC 
TTGCTGTTCT TCGTTCTGAC CATCCTGGTT GTAAAACGTA TATCATCCCT TCCGCTTCGC 
CTGCTTGTTG CCGCACCATT TGTGTTACTG ACTGCGGCAG ACATGAGTAT TAGCCTCTAT 
TCATGGTGTA CCTTTGGTAC AACTTTCAAT GATGGATTTG CGATTAGTGT GCTCCAGAGT 
GATCCGGATG AAGTTGTCAA AATGCTGGGG ATGTATATCC CTTATCTATG TGCCTTTGCT 
TTTTTATCCC TTCTTTTTTT GGCAGTAATA ATAAAATATG ATGTTTCCTT GCCGACAAAA 
AAAGTGACAG GAATATTATT GCTGATTGTC ATTTCGGGCA GTTTATTTTC CGCTTGTCAA 
TTTGCTTATA AAGATGCAAA AAATAAAAAA GCGTTCAGTC CATATATACT AGCGTCGCGA 
TTTGCTACCT ATACGCCGTT TTTCAATCTC AACTATTTTG CTTTAGCAGC GAAAGAGCAT 
CAAAGATTAC TCTCAATTGC AAACACGGTG CCGTATTTTC AATTATCAGT CAGGGATACA 
GGTATTGATA CCTACGTGTT GATTGTGGGG GAGTCTGTAC GTGTCGACAA TATGTCTTTG 
TATGGATATA CACGCTCTAC GACACCGCAA GTTGAAGCAC AAAGAAAACA GATCAAACTG 
TTTAATCAAG CAATAAGCGG CGCACCTTAC ACTGCGCTGT CGGTTCCCCT TTCTTTAACT 
GCTGATTCTG TTTTGAGTCA TGACATTCAT AATTACCCCG ACAACATTAT TAATATGGCT 
AATCAAGCAG GATTTCAGAC TTTCTGGCTA AGCTCGCAAT CCGCTTTTCG GCAGAATGGT 
ACAGCAGTTA CCAGTATCGC CATGCGCGCC ATGGAAACAG TTTATGTCAG AGGATTTGAT 
GAATTGTTGT TGCCGCATTT ATCGCAAGCA TTACAGCAAA ATACGCAGCA AAAGAAACTG 
ATTGTTCTTC ATTTAAATGG AAGCCATGAA CCGGCTTGTA GCGCCTATCC GCAATCCAGC 
GCCGTGTTTC AACCGCAGGA CGATCAGGAT GCCTGCTATG ACAACTCCAT TCATTACACA 
GATAGTTTGC TAGGTCAGGT TTTTGAATTA TTAAAAGATC GCCGCGCCTC GGTCATGTAT 
TTTGCCGACC ACGGCCTGGA ACGTGACCCT ACGAAGAAGA ACGTCTATTT TCATGGAGGC 
AGGGAGGCTA GCCAGCAGGC ATATCATGTC CCGATGTTTA TCTGGTATAG CCCCGTTCTT 
GGGGATGGCG TGGATCGCAC AACGGAAAAC AACATCTTTT CGACAGCTTA CAATAATTAC 
CTTATTAATG CGTGGATGGG GGTAACAAAG CCGGAACAGC CGCAAACGCT TGAGGAAGTG 
ATTGCACACT ATAAAGGAGA CTCACGGGTT GTGGATGCAA ACCATGATGT TTTCGATTAT 
GTGATGCTCA GAAAGGAGTT TACAGAGGAT AAGCAAGGTA ACCCCACCCC TGAAGGGCAG 
GGTTGA

Protein sequence

MTVFNKFARS FKSHWLLYLC VIVFGITNLV ASSGAHMVQR LLFFVLTILV VKRISSLPLR 
LLVAAPFVLL TAADMSISLY SWCTFGTTFN DGFAISVLQS DPDEVVKMLG MYIPYLCAFA 
FLSLLFLAVI IKYDVSLPTK KVTGILLLIV ISGSLFSACQ FAYKDAKNKK AFSPYILASR 
FATYTPFFNL NYFALAAKEH QRLLSIANTV PYFQLSVRDT GIDTYVLIVG ESVRVDNMSL 
YGYTRSTTPQ VEAQRKQIKL FNQAISGAPY TALSVPLSLT ADSVLSHDIH NYPDNIINMA 
NQAGFQTFWL SSQSAFRQNG TAVTSIAMRA METVYVRGFD ELLLPHLSQA LQQNTQQKKL 
IVLHLNGSHE PACSAYPQSS AVFQPQDDQD ACYDNSIHYT DSLLGQVFEL LKDRRASVMY 
FADHGLERDP TKKNVYFHGG REASQQAYHV PMFIWYSPVL GDGVDRTTEN NIFSTAYNNY 
LINAWMGVTK PEQPQTLEEV IAHYKGDSRV VDANHDVFDY VMLRKEFTED KQGNPTPEGQ 
G