Gene ECH74115_0998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0998
Symbol
ID	6971092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1014781
End bp	1015989
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	55%
IMG OID	643385014
Product	transporter, major facilitator family
Protein accession	YP_002269514
Protein GI	209397864
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.207413
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTAA ATTCTTCACG TAATGCATTG AAACGCCGAA CCTGGGCGCT GTTTATGTTC 
TTCTTTTTGC CGGGCCTGTT AATGGCGTCC TGGGCAACCC GTACGCCTGC TATCCGCGAT 
ATTCTCTCTG TCTCGATCGC TGAAATGGGC GGTGTTCTCT TTGGTCTGTC GATCGGTTCG 
ATGAGCGGTA TTCTCTGCTC GGCGTGGTTA GTGAAACGCT TTGGGACACG TAATGTCATC 
CTGGTCACCA TGTCCTGCGC ATTGGTCGGG ATGATGATAT TAAGTCTGGC ACTCTGGCTG 
ACATCGCCCC TGCTCTTTGC CGTTGGTCTC GGCGTCTTTG GGGCAAGTTT TGGTTCTGCG 
GAAGTGGCGA TAAACGTTGA AGGTGCCGCC GTTGAGCGAG AAATGAATAA AACGGTTTTG 
CCGATGATGC ACGGTTTTTA TAGCCTGGGC ACGCTGGCAG GCGCTGGTGT CGGGATGGCA 
CTGACGGCCT TTGGCGTTCC GGCAACGGTG CACATTTTAT TGGCGGCGCT GGTAGGCATC 
GCGCCTATAT ATATCGCCAT TCAGGCAATC CCTGACGGTA CGGGCAAAAA TGCTGCCGAT 
GGCACCCAGC ATGGCGAAAA AGGCGTACCT TTTTATCGCG ATATCCAGTT GCTGCTGATT 
GGTGTTGTGG TGCTGGCGAT GGCCTTTGCC GAAGGTTCTG CCAACGACTG GTTACCCTTA 
TTAATGGTTG ACGGTCACGG TTTTAGCCCC ACTTCCGGCT CGCTGATTTA TGCCGGTTTT 
ACCCTGGGGA TGACCGTTGG ACGCTTCACT GGCGGTTGGT TCATCGACCG TTACAGTCGC 
GTTGCCGTGG TTCGGGCCAG TGCGCTAATG GGGGCGTTGG GTATTGGGCT GATTATTTTT 
GTCGATAGCG CCTGGGTCGC TGGGGTGTCT GTTGTACTCT GGGGACTGGG TGCCTCGCTG 
GGCTTCCCGC TGACCATTTC TGCCGCCAGC GATACCGGCC CCGATGCACC AACCCGCGTC 
AGTGTGGTAG CAACGACCGG TTATCTGGCT TTCCTCGTCG GGCCGCCGCT GCTGGGCTAT 
CTCGGCGAAC ATTATGGATT ACGTAGTGCA ATGCTGGTTG TACTGGCGCT GGTTATTCTC 
GCGGCTATTG TCGCGAAAGC CGTCGCCAAA CCCGATACCA AAACGCAGAC GGCGATGGAG 
AATAGTTGA

Protein sequence

MTVNSSRNAL KRRTWALFMF FFLPGLLMAS WATRTPAIRD ILSVSIAEMG GVLFGLSIGS 
MSGILCSAWL VKRFGTRNVI LVTMSCALVG MMILSLALWL TSPLLFAVGL GVFGASFGSA 
EVAINVEGAA VEREMNKTVL PMMHGFYSLG TLAGAGVGMA LTAFGVPATV HILLAALVGI 
APIYIAIQAI PDGTGKNAAD GTQHGEKGVP FYRDIQLLLI GVVVLAMAFA EGSANDWLPL 
LMVDGHGFSP TSGSLIYAGF TLGMTVGRFT GGWFIDRYSR VAVVRASALM GALGIGLIIF 
VDSAWVAGVS VVLWGLGASL GFPLTISAAS DTGPDAPTRV SVVATTGYLA FLVGPPLLGY 
LGEHYGLRSA MLVVLALVIL AAIVAKAVAK PDTKTQTAME NS