Gene ECH74115_4392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4392
Symbol
ID	6972075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4068848
End bp	4070281
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	49%
IMG OID	643388114
Product	amino acid permease family protein
Protein accession	YP_002272551
Protein GI	209400233
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATA CCAAACGTAA TACAATCGGC AAATTCGGCT TGCTCTCGCT GACTTTTGCC 
GCCGTTTACA GCTTTAACAA CGTTATCAAT AATAATATTG AGCTTGGACT GGCCTCGGCA 
CCGATGTTTT TCCTCGCGAC GATTTTTTAT TTTATTCCCT TCTGTCTGAT CATCGCAGAA 
TTTGTTTCGT TAAATAAAAA CTCAGAAGCC GGTGTCTACG CGTGGGTAAA AAGTTCGCTG 
GGCGGACGTT GGGCATTTAT TACTGCCTAT ACCTACTGGT TCGTAAACCT GTTCTTTTTC 
ACCTCGCTGT TGCCGCGCGT TATTGCTTAT GCTTCGTATG CCTTCCTCGG CTATGAATAT 
ATTATGACGC CGGTTGCCAC CACCATTATC AGTATGGTGC TGTTCGCCTT CTCCACCTGG 
GTTTCCACCA ACGGGGCGAA AATGTTGGGG CCAATTACCT CCGTCACTTC AACGCTGATG 
CTGCTGTTAA CGCTCTCCTA CATTTTACTG GCAGGTACGG CGCTGGTTGG CGGCGTACAG 
CCTGCTGACC CCATCACCGT TGACGCGATG ATCCCGAACT TCAACTGGGC GTTCCTCGGC 
GTTACCACCT GGATCTTTAT GGCCGCAGGT GGCGCGGAGT CCGTCGCTGT GTACGTTAAC 
GACGTCAAAG GCGGTTCGAA ATCGTTCGTT AAAGTGATCA TCCTCGCCGG GATTTTTATC 
GGTGTACTAT ATTCCGTCTC CTCGGTGCTG ATTAACGTCT TCGTCAGCAG CAAAGAGTTG 
AAATTTACTG GCGGATCGGT GCAGGTATTC CACGGCATGG CGGCGTATTT TGGTCTGCCG 
GAAGCGTTGA TGAATCGCTT TGTCGGTCTG GTGTCCTTTA CCGCAATGTT CGGTTCCCTG 
CTGATGTGGA CCGCAACGCC GGTGAAAATT TTCTTCTCCG AAATCCCGGA AGGCATCTTT 
GGTAAGAAAA CCGTCGAACT TAACGAAAAC GGCGTTCCGG CGCGCGCAGC GTGGATCCAG 
TTCCTGATCG TCATCCCGCT GATGATTATC CCGATGCTCG GTTCCAATAC TGTGCAGGAT 
CTGATGAATA CTATTATTAA TATGACCGCC GCAGCGTCCA TGCTTCCGCC GTTATTCATC 
ATGCTGGCTT ACCTGAATTT ACGCGCCAAA TTAGATCACC TGCCACGCGA TTTCCGTATG 
GGCTCCCGCC GCACCGGTAT TATCGTTGTT TCAATGCTGA TTGCGATATT TGCCGTAGGG 
TTTGTCGCTT CGACATTCCC GACTGGCGCG AATATTCTGA CCATCATTTT TTATAACGTC 
GGCGGTATTG TTATATTCCT TGGCTTTGCG TGGTGGAAAT ACAGTAAATA TATAAAGGGA 
TTAACGGCTG AAGAGCGCCA TATTGAAGCG ACGCCAGCCA GCAATGTTGA TTAA

Protein sequence

MSDTKRNTIG KFGLLSLTFA AVYSFNNVIN NNIELGLASA PMFFLATIFY FIPFCLIIAE 
FVSLNKNSEA GVYAWVKSSL GGRWAFITAY TYWFVNLFFF TSLLPRVIAY ASYAFLGYEY 
IMTPVATTII SMVLFAFSTW VSTNGAKMLG PITSVTSTLM LLLTLSYILL AGTALVGGVQ 
PADPITVDAM IPNFNWAFLG VTTWIFMAAG GAESVAVYVN DVKGGSKSFV KVIILAGIFI 
GVLYSVSSVL INVFVSSKEL KFTGGSVQVF HGMAAYFGLP EALMNRFVGL VSFTAMFGSL 
LMWTATPVKI FFSEIPEGIF GKKTVELNEN GVPARAAWIQ FLIVIPLMII PMLGSNTVQD 
LMNTIINMTA AASMLPPLFI MLAYLNLRAK LDHLPRDFRM GSRRTGIIVV SMLIAIFAVG 
FVASTFPTGA NILTIIFYNV GGIVIFLGFA WWKYSKYIKG LTAEERHIEA TPASNVD