Gene EcolC_1498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1498
Symbol
ID	6067108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1654776
End bp	1655774
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	51%
IMG OID	641600917
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001724487
Protein GI	170019533
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01168] Gram-positive signal peptide, YSIRK family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGA AGGTGTTAAC CCTGTCTGCT GTGATGGCCA GCATGTTATT CGGTGCCGCT 
GCACACGCTG CTGATACTCG CATTGGTGTA ACAATCTATA AGTACGACGA TAACTTTATG 
TCTGTAGTGC GCAAGGCTAT TGAGCAAGAT GCGAAAGCCG CGCCAGATGT TCAGCTGCTG 
ATGAATGATT CTCAGAATGA CCAGTCCAAG CAGAACGATC AGATCGACGT ATTGCTGGCG 
AAAGGGGTGA AGGCACTGGC AATCAACCTG GTTGACCCGG CAGCTGCGGG TACGGTGATT 
GAGAAAGCGC GTGGGCAAAA CGTGCCGGTG GTTTTCTTCA ACAAAGAACC GTCTCGTAAG 
GCGCTGGATA GCTACGACAA AGCCTACTAC GTTGGCACTG ATTCCAAAGA GTCCGGCATT 
ATTCAGGGCG ATTTGATTGC TAAACACTGG GCGGCGAATC AGGGTTGGGA TCTGAACAAA 
GACGGTCAGA TTCAATTCGT ATTGCTGAAA GGTGAACCGG GCCATCCGGA TGCAGAAGCA 
CGTACCACTT ACGTGATTAA AGAGCTGAAC GACAAAGGCA TTAAAACTGA ACAGTTACAG 
TTAGATACCG CTATGTGGGA TACCGCTCAG GCGAAAGATA AGATGGACGC CTGGCTGTCT 
GGCCCGAACG CCAACAAAAT CGAAGTGGTT ATCGCCAACA ACGATGCGAT GGCAATGGGC 
GCGGTAGAAG CACTGAAAGC ACACAACAAG TCCAGCATTC CGGTGTTTGG CGTCGATGCG 
CTGCCAGAAG CGCTGGCGCT GGTGAAATCC GGTGCACTGG CGGGCACAGT ACTGAACGAT 
GCTAACAACC AGGCGAAAGC GACCTTTGAT CTGGCGAAAA ACCAGGCCGA TGGCAAAGGT 
GCGGCTGATG GCACCAACTG GAAAATCGAC AACAAAGTGG TCCGCGTACC TTATGTTGGC 
GTAGATAAAG ACAACCTGGC TGAATTCAGC AAGAAATAA

Protein sequence

MNKKVLTLSA VMASMLFGAA AHAADTRIGV TIYKYDDNFM SVVRKAIEQD AKAAPDVQLL 
MNDSQNDQSK QNDQIDVLLA KGVKALAINL VDPAAAGTVI EKARGQNVPV VFFNKEPSRK 
ALDSYDKAYY VGTDSKESGI IQGDLIAKHW AANQGWDLNK DGQIQFVLLK GEPGHPDAEA 
RTTYVIKELN DKGIKTEQLQ LDTAMWDTAQ AKDKMDAWLS GPNANKIEVV IANNDAMAMG 
AVEALKAHNK SSIPVFGVDA LPEALALVKS GALAGTVLND ANNQAKATFD LAKNQADGKG 
AADGTNWKID NKVVRVPYVG VDKDNLAEFS KK