Gene EcSMS35_3115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3115
Symbol	lacY
ID	6146325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3202040
End bp	3203317
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	46%
IMG OID	641617982
Product	galactoside permease
Protein accession	YP_001745132
Protein GI	170683854
COG category
COG ID
TIGRFAM ID	[TIGR00882] oligosaccharide:H+ symporter

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0255021
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCTG CAAGTACGCA TAAAAATCCC GATTTCTGGA TTTTCGGTCT GTTCTTCTTT 
CTCTACTTTT TCATCATGGC AACCTGTTTT CCGTTTTTGC CTGTATGGCT GTCCGATGTG 
GTCGGACTGA GTAAAACGGA TACAGGTATA GTCTTTTCAT GTCTTTCTCT GTTTGCCATC 
AGTTTCCAGC CATTGCTTGG GGTCATATCA GATCGCCTGG GACTGAAAAA AAACCTGATC 
TGGAGTATCA GCCTGTTACT TGTATTTTTC GCCCCCTTTT TTTTATATGT ATTTGCGCCC 
CTGCTGCGCT TCAATATCTG GGCAGGCGCA CTGACTGGCG GTGTCTTTAT TGGTTTTGTG 
TTTTCTGCAG GTGCCGGAGC TATTGAAGCT TATATAGAGC GGGTCAGTCG CAGTCGTGGA 
TTTGAATACG GTAAAGCGAG GATGTTCGGG TGTCTGGGCT GGGCGTTATG TGCGGCTATG 
GCTGGAATGC TTTTTAATGT CGATCCTTCT CTGGTTTTCT GGATGGGGTC AGGAAGCGCA 
TTATTGTTGC TTCTTCTGTT GTTTCTGGCG CGCCCCAGTA CCAGCCAGAC GGCAATGGTT 
ATGAATACAC TGGGTGCCAA TTCTTCCCTG ATTTCGACCA GAATGGTCTT CAGCCTGTTT 
CGCATGCGTC AGATGTGGAT GTTTGTTCTC TACACGATTG GTGTGGCCTG TGTCTATGAT 
GTATTTGATC AGCAGTTTGC CACATTTTTT CGTTCATTCT TTGACACTCC TCAGGCAGGA 
ATAAAAGCAT TCGGATTTGC TACCACTGCG GGGGAGATTT GTAATGCCAT TATCATGTTC 
TGTACACCAT GGATAATTCA TCGCATTGGT GCCAAAAATA CCCTGCTTGT TGCGGGGGGA 
ATTATGACCA TCCGCATTAC CGGTTCTGCT TTTGCCACCA CCGCGACAGA AGTGGTGATT 
CTGAAAATGC TTCACGCTCT TGAAGTTCCA TTTTTGCTGG TTGGGGCGTT CAAATATATT 
ACGGCAGTGT TTGACACCCG ACTGTCAGCG ACCGTTTATT TAATAGGTTT TCAGTTTTCC 
AAACAACTTG CTGCAATACT TCTCTCTACC TTTGCCGGCC ACCTGTATGA TCGTATGGGA 
TTCCAGAATA CGTATTTTGT GCTCGGGATG ATTGCTCTGA CTGTTACCGT GATATCAGTT 
TTCACGCTGA GTTCTTCCCG CGGGAGCGTA CACCCTTCTG TAGAAAAAGC CCCTGCAGCG 
CATTCGGAGA TTAACTGA

Protein sequence

MNSASTHKNP DFWIFGLFFF LYFFIMATCF PFLPVWLSDV VGLSKTDTGI VFSCLSLFAI 
SFQPLLGVIS DRLGLKKNLI WSISLLLVFF APFFLYVFAP LLRFNIWAGA LTGGVFIGFV 
FSAGAGAIEA YIERVSRSRG FEYGKARMFG CLGWALCAAM AGMLFNVDPS LVFWMGSGSA 
LLLLLLLFLA RPSTSQTAMV MNTLGANSSL ISTRMVFSLF RMRQMWMFVL YTIGVACVYD 
VFDQQFATFF RSFFDTPQAG IKAFGFATTA GEICNAIIMF CTPWIIHRIG AKNTLLVAGG 
IMTIRITGSA FATTATEVVI LKMLHALEVP FLLVGAFKYI TAVFDTRLSA TVYLIGFQFS 
KQLAAILLST FAGHLYDRMG FQNTYFVLGM IALTVTVISV FTLSSSRGSV HPSVEKAPAA 
HSEIN