Gene ECH74115_5844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5844
Symbol
ID	6968143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5495559
End bp	5496737
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	54%
IMG OID	643389466
Product	transporter, major facilitator family
Protein accession	YP_002273858
Protein GI	209396495
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.482212
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCGA CATCGCATCC CGTAGAACGT TTTTCTTTCA GCACCGCGTT ATTCGGGATG 
CTGGTTCTGA CCTTAGGTAT GGGTTTAGGC CGCTTTCTCT ATACGCCGAT GCTGCCAGTC 
ATGCTGGCGG AAGGCGAGTT TTCATTTAGC GAACTCTCAT GGATCGCCAG TGGTAACTAT 
GCCGGGTATC TGGCGGGGAG CCTGCTGTTT TCATTCGGCG CGTTTCATTT ACCCTCACGC 
CTGCGCCCGT TCCTGTTAGC TTCCGCCCTC GCAACCGGAT TATTAATCCT CGCGATGGCG 
TGGCTGCCGC CGTTTCTTCT GGTTTTCATC ATTCGCTTTC TGGCGGGAGT CGCCAGCGCC 
GGGATGTTGA TTTTCGGCTC AACACTCATC ATGCAACATA CTCGCCATCC CTTTGTCCTT 
GCGGCGCTAT TTTCTGGTGT TGGCGTCGGC ATCGCTCTGG GTAATGAATA TGTGCTGGCA 
GGCCTGCATT TTGCCCTCTC TTCACAAACG TTGTGGCAAG GTGCCGGAGC ACTTTCTGCC 
ATTATATTGC TTGCTCTGGC GCTGCTCATC CCGTCGAATA AACACGTTAT CCCGCCAGCG 
CCATTGGCAA AAATCGCGCA ACAACCCATG AGCTGGTGGT TACTGGCGAT TCTGTATGGT 
CTGGCGGGTT TTGGTTATAT CATCGTCGCC ACCTACCTGC CGCTCATGGC GAAAGACGCG 
GGCCAGCCTG TGTTGACGGC TCACCTCTGG ACACTGGTTG GCTTGTCGAT TGTCCCAGGT 
TGCTTTGGCT GGCTGTGGGC AGCCAAACGG TGGGGAGCAT TACCTTGCCT GACCGCGAAT 
TTGCTGGTGC AGGCGATCTG CGTGCTGTTA ACCCTCGCCA GCAGCTCTCC TTTATTACTC 
ATCATCAGCA GTATTGGTTT TGGCGGCACC TTTATGGGAA CGACCTCGCT GGTGATGACC 
ATCGCCCGCC AGCTTAGCGT GCCGGGAAAT CTTAACCTTT TGGGCTTTGT GACACTCATT 
TATGGTATCG GGCAAATTCT TGGCCCGGCG CTGACCAGTA TGCTCGGCAA CGGAACGTCG 
GCGCTCGCCA GCGCCACACT CTGCGGCGCA GCGGCGCTAT TTATCGCAGC ATTAATCTGC 
GGGATGCAAA TATTCAAATT GCATACGAAT TATTCTTAA

Protein sequence

MNSTSHPVER FSFSTALFGM LVLTLGMGLG RFLYTPMLPV MLAEGEFSFS ELSWIASGNY 
AGYLAGSLLF SFGAFHLPSR LRPFLLASAL ATGLLILAMA WLPPFLLVFI IRFLAGVASA 
GMLIFGSTLI MQHTRHPFVL AALFSGVGVG IALGNEYVLA GLHFALSSQT LWQGAGALSA 
IILLALALLI PSNKHVIPPA PLAKIAQQPM SWWLLAILYG LAGFGYIIVA TYLPLMAKDA 
GQPVLTAHLW TLVGLSIVPG CFGWLWAAKR WGALPCLTAN LLVQAICVLL TLASSSPLLL 
IISSIGFGGT FMGTTSLVMT IARQLSVPGN LNLLGFVTLI YGIGQILGPA LTSMLGNGTS 
ALASATLCGA AALFIAALIC GMQIFKLHTN YS