Gene ECH74115_4886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4886
Symbol
ID	6967783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4520001
End bp	4521323
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	56%
IMG OID	643388574
Product	MFS transporter, metabolite:H+ symporter (MHS) family protein
Protein accession	YP_002273002
Protein GI	209400488
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCAA CAGCCACAAC ACTCGACCAC GAGCAAGAAT ACACGCCGAT CAACTCGCGT 
AATAAAGTCC TTGTCGCCTC TCTCATTGGC ACGGCCATTG AGTTCTTCGA CTTTTACATT 
TACGCCACTG CGGCCGTTAT TGTGTTTCCG CATATCTTCT TCCCGCAGGG CGATCCTACG 
GCAGCAACGC TACAGTCGCT CGCCACCTTC GCCATCGCCT TCGTCGCGCG CCCCATTGGC 
TCTGCCGTTT TTGGTCATTT TGGCGATCGC GTTGGGCGTA AAGCGACGCT GGTCGCCTCG 
TTGCTAACGA TGGGGATTTC GACCGTGGTG ATTGGTCTGC TGCCAGGCTA TGCCACGATT 
GGTATTTTCG CCCCGCTGCT GCTGGCGCTG GCTCGATTTG GTCAGGGTCT GGGCTTAGGT 
GGTGAATGGG GCGGCGCGGC GCTGCTGGCG ACTGAAAACG CCCCACCGCG CAAACGTGCA 
TTGTACGGCT CCTTCCCGCA GCTGGGCGCA CCGATTGGCT TCTTCTTTGC CAACGGCACT 
TTCTTGCTGC TTTCCTGGCT ACTGACCGAC GAGCAGTTTA TGAGCTGGGG CTGGCGTGTG 
CCATTTATCT TCTCGGCGGT GCTGGTCATT ATCGGCCTGT ATGTTCGCGT GTCGCTGCAT 
GAGTCGCCGG TGTTTGAGAA AGTCGCTAAA GCGAAAAAAC AGGTGAAGAT CCCGCTGGGT 
ACGCTGCTGA CCAAACATGT TCGCGTAACC GTACTGGGTA CGTTCATTAT GCTGGCAACC 
TATACGCTGT TTTACATCAT GACGGTCTAC TCTATGACCT TTAGTACCGC CGCCGCGCCA 
GTTGGGCTTG GCCTGCCGCG TAACGAAGTG TTGTGGATGT TGATGATGGC AGTTATTGGT 
TTTGGCGTGA TGGTGCCAGT CGCTGGATTA CTGGCTGATG CCTTTGGTCG CCGTAAAAGC 
ATGGTAATCA TCACCACGCT GATCATCCTG TTCGCGCTGT TCGCCTTTAA CCCACTGCTC 
GGTTCTGGCA ACCCGATTCT GGTTTTTGCC TTCCTGCTGC TGGGGTTAAG TCTGATGGGT 
CTGACCTTCG GGCCAATGGG TGCGCTGTTA CCAGAGCTGT TTCCGACAGA AGTGCGTTAC 
ACCGGAGCAT CGTTCTCTTA CAACGTAGCG TCGATTCTCG GGGCTTCCGT TGCGCCATAT 
ATCGCAGCCT GGTTGCAGAC TAACTACGGG CTAAGTGCGG TGGGGTTATA TCTGGCGGCG 
ATGGCTGGCT TGACGTTAAT CGCCCTGCTG CTGACCCATG AGACGCGACA TCAGTCGTTG 
TAA

Protein sequence

MQATATTLDH EQEYTPINSR NKVLVASLIG TAIEFFDFYI YATAAVIVFP HIFFPQGDPT 
AATLQSLATF AIAFVARPIG SAVFGHFGDR VGRKATLVAS LLTMGISTVV IGLLPGYATI 
GIFAPLLLAL ARFGQGLGLG GEWGGAALLA TENAPPRKRA LYGSFPQLGA PIGFFFANGT 
FLLLSWLLTD EQFMSWGWRV PFIFSAVLVI IGLYVRVSLH ESPVFEKVAK AKKQVKIPLG 
TLLTKHVRVT VLGTFIMLAT YTLFYIMTVY SMTFSTAAAP VGLGLPRNEV LWMLMMAVIG 
FGVMVPVAGL LADAFGRRKS MVIITTLIIL FALFAFNPLL GSGNPILVFA FLLLGLSLMG 
LTFGPMGALL PELFPTEVRY TGASFSYNVA SILGASVAPY IAAWLQTNYG LSAVGLYLAA 
MAGLTLIALL LTHETRHQSL