Gene EcHS_A0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0407
Symbol	lacY
ID	5594579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	426432
End bp	427685
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	46%
IMG OID	640919592
Product	galactoside permease
Protein accession	YP_001457177
Protein GI	157159859
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00882] oligosaccharide:H+ symporter

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.00583816
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACTATT TAAAAAACAC AAACTTTTGG ATGTTCGGTT TATTCTTTTT CTTTTACTTT 
TTTATCATGG GAGCCTACTT CCCGTTTTTC CCGATTTGGC TACATGACAT CAACCATATC 
AGCAAAAGTG ATACGGGTAT TATTTTTGCT GCTATTTCTC TGTTCTCGCT ATTATTCCAA 
CCGCTGTTTG GTCTGCTTTC TGACAAACTC GGGCTGCGCA AATACCTGCT GTGGATTATT 
ACCGGCATGT TAGTGATGTT TGCGCCGTTC TTTATTTTTA TCTTCGGGCC ACTGTTACAA 
TACAACATTT TAGTAGGATC GATTGTTGGT GGTATTTATC TAGGCTTTTG TTTTAACGCC 
GGTGCGCCCG CAGTAGAGGC ATTTATCGAG AAAGTCAGCC GTCGCAGTAA TTTCGAATTT 
GGTCGCGCGC GGATGTTTGG CTGTGTTGGC TGGGCGCTGT GTGCCTCGAT TGTCGGCATC 
ATGTTCACCA TCAATAATCA GTTCGTTTTC TGGCTGGGTT CTGGCTGTGC ACTCATCCTC 
GCCATTTTAC TCTTTTTCGC CAAAACGGAT GCGCCCTCTT CCGCCACGGT TGCCAATGCG 
GTAGGTGCCA ACCATTCGGC ATTTAGCCTT AAACTGGCGC TGGAACTGTT CAGACAGCCA 
AAACTGTGGT TTTTGTCACT GTATGTTATT GGCGTTTCCT GCACCTACGA TGTTTTTGAC 
CAACAGTTTG CTAATTTCTT TACTTCTTTC TTTGCCACCG GTGAACAGGG TACGCGGGTA 
TTTGGCTACG TAACGACAAT GGGCGAATTA CTTAACGCCT CGATTATGTT CTTTGCGCCA 
CTGATCATTA ATCGCATCGG TGGGAAAAAC GCCCTGCTGC TGGCTGGCAC TATTATGTCT 
GTACGTATTA TTGGCTCATC GTTCGCCACC TCAGCGCTGG AAGTGGTTAT TCTGAAAACG 
CTGCATATGT TTGAAGTACC GTTCCTGCTG GTGGGCTGCT TTAAATATAT TACCAGCCAG 
TTTGAAGTGC GTTTTTCAGC GACGATTTAT CTGGTCTGTT TCTGCTTCTT TAAGCAACTG 
GCGATGATTT TTATGTCTGT ACTGGCGGGC AATATGTATG AAAGCATCGG TTTCCAGGGC 
GCTTATCTGG TGCTGGGTCT GGTGGCGCTG GGCTTCACCT TAATTTCCGT GTTCACGCTT 
AGCGGCCCCG GCCCGCTTTC CCTGCTGCGT CGTCAGGTGA ATGAAGTCGC TTAA

Protein sequence

MYYLKNTNFW MFGLFFFFYF FIMGAYFPFF PIWLHDINHI SKSDTGIIFA AISLFSLLFQ 
PLFGLLSDKL GLRKYLLWII TGMLVMFAPF FIFIFGPLLQ YNILVGSIVG GIYLGFCFNA 
GAPAVEAFIE KVSRRSNFEF GRARMFGCVG WALCASIVGI MFTINNQFVF WLGSGCALIL 
AILLFFAKTD APSSATVANA VGANHSAFSL KLALELFRQP KLWFLSLYVI GVSCTYDVFD 
QQFANFFTSF FATGEQGTRV FGYVTTMGEL LNASIMFFAP LIINRIGGKN ALLLAGTIMS 
VRIIGSSFAT SALEVVILKT LHMFEVPFLL VGCFKYITSQ FEVRFSATIY LVCFCFFKQL 
AMIFMSVLAG NMYESIGFQG AYLVLGLVAL GFTLISVFTL SGPGPLSLLR RQVNEVA