Gene EcSMS35_0374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0374
Symbol	lacY
ID	6146499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	386144
End bp	387397
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	46%
IMG OID	641615270
Product	galactoside permease
Protein accession	YP_001742477
Protein GI	170680767
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00882] oligosaccharide:H+ symporter

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.131183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTATT TAAAAAACAC AAACTTTTGG ATGTTCGGTT TATTCTTTTT CTTTTACTTT 
TTTATCATGG GAGCCTACTT CCCATTTTTC CCGATTTGGC TACATGACAT CAACCATATC 
AGCAAAAGTG ATACGGGTAT TATTTTTGCT GCTATTTCTC TGTTCTCGCT ATTATTCCAA 
CCGCTGTTTG GTCTGCTTTC TGACAAACTC GGGCTGCGCA AATACCTGCT GTGGATTATT 
ACCGGCATGT TAGTGATGTT TGCGCCGTTC TTTATTTTTA TCTTCGGGCC ACTGTTACAA 
TACAACATTT TAGTAGGATC GATTGTTGGT GGTATTTATC TTGGCTTTTG TTTTAACGCC 
GGTGCGCCAG CAGTAGAGGC ATTTATCGAG AAAGTCAGCC GTCGCAGTAA TTTCGAATTT 
GGTCGCGCGC GGATGTTTGG CTGTGTTGGC TGGGCGCTGT GTGCCTCGAT TGTCGGTATC 
ATGTTCACCA TCAATAATCA GTTTGTTTTC TGGCTGGGTT CTGGCTGTGC ACTCATCCTC 
GCCGTTTTAC TCTTTTTCGC CAAAACGGAT GCACCCTCTT CCGCCACGGT TGCCAATGCG 
GTAGGTGCCA ACCATTCGGC ATTTAGCCTT AAGCTGGCGC TGGAACTGTT CAGACAGCCA 
AAACTGTGGT TTTTGTCACT GTATGTTATT GGCGTTTCCT GCACCTACGA TGTTTTTGAC 
CAACAGTTTG CTAATTTCTT TACTTCGTTC TTTGCTACCG GTGAACAGGG TACGCGGGTA 
TTTGGCTACG TAACGACAAT GGGCGAATTA CTTAACGCCT CGATTATGTT CTTTGCGCCA 
CTGATCATTA ATCGCATCGG TGGGAAAAAC GCCCTACTGC TGGCTGGCAC TATTATGTCT 
GTACGTATTA TTGGCTCATC GTTCGCCACC TCAGCGCTGG AAGTGGTTAT TCTGAAAACG 
CTGCATATGT TTGAAGTACC GTTCCTGCTG GTGGGCTGCT TTAAATATAT TACCAGCCAG 
TTTGAAGTGC GTTTTTCAGC GACGATTTAT CTGGTCTGTT TCTGCTTCTT TAAGCAACTG 
GCGATGATTT TTATGTCTGT ACTGGCGGGC AATATGTATG AAAGCATCGG TTTCCAGGGC 
GCTTATCTGG TGCTGGGTCT GGTGGCGTTG GGCTTCACCT TAATTTCCGT GTTCACGCTT 
AGCGGCCCCG GTCCGCTTTC TCTACTGCGT CGTCAGGTGA ATGAAGTCGC TTAA

Protein sequence

MYYLKNTNFW MFGLFFFFYF FIMGAYFPFF PIWLHDINHI SKSDTGIIFA AISLFSLLFQ 
PLFGLLSDKL GLRKYLLWII TGMLVMFAPF FIFIFGPLLQ YNILVGSIVG GIYLGFCFNA 
GAPAVEAFIE KVSRRSNFEF GRARMFGCVG WALCASIVGI MFTINNQFVF WLGSGCALIL 
AVLLFFAKTD APSSATVANA VGANHSAFSL KLALELFRQP KLWFLSLYVI GVSCTYDVFD 
QQFANFFTSF FATGEQGTRV FGYVTTMGEL LNASIMFFAP LIINRIGGKN ALLLAGTIMS 
VRIIGSSFAT SALEVVILKT LHMFEVPFLL VGCFKYITSQ FEVRFSATIY LVCFCFFKQL 
AMIFMSVLAG NMYESIGFQG AYLVLGLVAL GFTLISVFTL SGPGPLSLLR RQVNEVA