Gene ECH74115_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1938
Symbol
ID	6967275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1832750
End bp	1834135
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	53%
IMG OID	643385868
Product	amino acid permease
Protein accession	YP_002270357
Protein GI	209398619
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.173953
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATTA ATTCACCACT GAATATTGCT GCGCAACCCG GCAAAACCCG TCTGCGAAAA 
TCACTGAAAT TGTGGCAGGT TGTGATGATG GGTCTGGCCT ATCTCACGCC GATGACTGTG 
TTCGATACCT TTGGCATTGT ATCTGGCATT AGCGACGGTC ACGTCCCTGC GTCCTATTTG 
CTGGCGCTGG CGGGCGTGCT GTTTACCGCT ATCAGCTACG GCAAACTGGT TCGCCAGTTT 
CCGGAGGCCG GTTCGGCCTA TACCTACGCG CAAAAGTCGA TTAACCCGCA CGTCGGATTT 
ATGGTCGGCT GGTCATCACT GCTGGATTAT CTCTTTTTGC CGATGATCAA CGTTTTGTTG 
GCGAAAATCT ATCTCTCCGC CCTCTTCCCG GAAGTGCCGC CGTGGGTGTG GGTGGTAACC 
TTCGTCGCCA TTTTAACCGC CGCGAATCTG AAGAGCGTCA ACCTGGTCGC TAACTTCAAT 
ACCCTGTTTG TACTGGTGCA AATCTCCATC ATGGTGGTGT TTATCTTCCT GGTGGTTCAG 
GGACTGCATA AAGGAGAAGG CGTTGGCACC GTCTGGTCAC TTCAGCCGTT TATCAGCGAG 
AACGCGCACC TGATCCCGAT TATTACCGGG GCGACGATTG TCTGTTTCTC GTTCCTCGGT 
TTCGATGCGG TGACCACACT TTCGGAAGAG ACACCAGACG CCGCACGCGT GATCCCGAAA 
GCCATCTTCC TGACGGCGGT CTATGGTGGC GTTATCTTTA TCGCGGCGTC GTTCTTTATG 
CAGCTGTTCT TCCCCGATAT CAGCCGCTTT AAAGACCCGG ACGCCGCACT GCCTGAAATT 
GCACTCTACG TCGGCGGTAA GCTGTTCCAG TCGATTTTCC TCTGCACCAC GTTTGTGAAC 
ACGTTAGCGT CTGGCCTGGC CTCACATGCC AGCGTGTCAC GTCTGCTGTA TGTGATGGGG 
CGCGACAATG TGTTTCCGGA GCGCGTGTTT GGCTATGTGC ACCCAAAATG GCGGACTCCG 
GCACTGAACG TCATTATGGT CGGAATTGTC GCGATGTCGG CATTGTTCTT TGATTTAGTC 
ACCGCGACAG CATTGATTAA CTTCGGTGCT CTGGTGGCGT TTACCTTCGT GAATCTGTCG 
GTGTTTAATC ATTTCTGGCG GCGTAAAGGA ATGAATAAAA GCTGGAAGGA TCACTTCCAC 
TATTTGCTGA TGCCGCTGGT TGGCGCGCTG ACGGTGGGTG TGCTGTGGGT TAACCTCGAG 
TCAACGTCAC TGACACTCGG TCTGGTATGG GCTTCGTTAG GCGGCGCATA TTTGTGGTAT 
TTGATCCGCC GCTATCGCAA AGTGCCGCTG TACGAAGGTG ACAGAACGCC AGTGAGCGAA 
ACGTAA

Protein sequence

MAINSPLNIA AQPGKTRLRK SLKLWQVVMM GLAYLTPMTV FDTFGIVSGI SDGHVPASYL 
LALAGVLFTA ISYGKLVRQF PEAGSAYTYA QKSINPHVGF MVGWSSLLDY LFLPMINVLL 
AKIYLSALFP EVPPWVWVVT FVAILTAANL KSVNLVANFN TLFVLVQISI MVVFIFLVVQ 
GLHKGEGVGT VWSLQPFISE NAHLIPIITG ATIVCFSFLG FDAVTTLSEE TPDAARVIPK 
AIFLTAVYGG VIFIAASFFM QLFFPDISRF KDPDAALPEI ALYVGGKLFQ SIFLCTTFVN 
TLASGLASHA SVSRLLYVMG RDNVFPERVF GYVHPKWRTP ALNVIMVGIV AMSALFFDLV 
TATALINFGA LVAFTFVNLS VFNHFWRRKG MNKSWKDHFH YLLMPLVGAL TVGVLWVNLE 
STSLTLGLVW ASLGGAYLWY LIRRYRKVPL YEGDRTPVSE T