Gene ECH74115_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0049
Symbol
ID	6968532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	50217
End bp	51548
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	643384130
Product	major facilitator family transporter
Protein accession	YP_002268653
Protein GI	209398741
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACCGT CCAGAAACTT TGACGATCTT AAATTTTCCT CTATTCACCG CCGCATTTTG 
CTGTGGGGAA GCGGTGGTCC GTTTCTGGAT GGTTATATAC TGGTAATGAT TGGCGTGGCG 
CTGGAGCAAC TGACGCCGGC GCTAAAACTG GACGCTGACT GGATTGGCTT GCTGGGCGCG 
GGAACGCTCG CCGGGCTGTT CGTTGGCACA TCGCTGTTTG GTTATATTTC CGATAAAGTC 
GGACGGCGCA AAATGTTCCT CATTGATATC ATCGCCATCG GCGTGATATC GGTGGCGACG 
ATGTTTGTTT CATCCCCCGT CGAACTGTTG GTGATGCGGG TACTTATCGG CATTGTCATC 
GGTGCAGACT ATCCCATCGC CACTTCGATG ATCACTGAGT TCTCCAGTAC CCGTCAGCGG 
GCGTTTTCCA TCAGCTTTAT CGCCGCCATG TGGTATGTCG GCGCGACCTG TGCCGATCTG 
GTCGGCTACT GGCTTTATGA TGTGGAAGGC GGCTGGCGCT GGATGCTGGG TAGCGCGGCG 
ATCCCCTGTT TGTTGATTTT GATTGGTCGA TTCGAACTGC CTGAATCTCC CCGCTGGTTA 
TTACGCAAAG GGCGAGTAAA AGAGTGCGAA GAGATGATGA TCAAACTGTT TGGCGAACCG 
GTGGCTTTCG ATGAAGAGCA GCCGCAGCAA ACCCGTTTTC GCGATCTGTT TAATCGCCGC 
CATTTTCCTT TTGTTCTGTT TGTTGCCGCC ATCTGGACCT GCCAGGTGAT CCCAATGTTC 
GCCATTTACA CCTTTGGCCC GCAAATCGTT GGTTTGTTGG GATTGGGTGT TGGCAAAAAC 
GCGGCACTGG GGAACGTGGT GATTAGCCTG TTCTTTATGC TCGGCTGTAT TCCGCCGATG 
CTGTGGCTAA ACACTGCCGG ACGGCGTCCA TTGTTGATTG GCAGCTTTGC CATGATGACG 
CTGGCGCTGG CGGTTTTGGG GCTGATCCCG GATATGGGGA TCTGGCTGGT AGTGATGGCC 
TTTGCGGTGT ATGCCTTTTT CTCTGGCGGG CCGGGTAATT TGCAGTGGCT CTATCCTAAT 
GAACTCTTCC CGACGGATAT CCGCGCCTCT GCCGTGGGCG TGATTATGTC CTTAAGTCGT 
ATTGGCACCA TTGTTTCGAC CTGGGCACTA CCGATCTTTA TCAATAATTA CGGTATCAGT 
AACACGATGC TAATGGGGGC GGGTATCTCG CTGTTTGGCT TGTTGATTTC CGTAGCGTTT 
GCCCCGGAGA CTCGAGGGAT GTCACTGGCG CAGACCAGCA ATATGACGAT CCGCGGGCAG 
AGAATGGGGT AA

Protein sequence

MQPSRNFDDL KFSSIHRRIL LWGSGGPFLD GYILVMIGVA LEQLTPALKL DADWIGLLGA 
GTLAGLFVGT SLFGYISDKV GRRKMFLIDI IAIGVISVAT MFVSSPVELL VMRVLIGIVI 
GADYPIATSM ITEFSSTRQR AFSISFIAAM WYVGATCADL VGYWLYDVEG GWRWMLGSAA 
IPCLLILIGR FELPESPRWL LRKGRVKECE EMMIKLFGEP VAFDEEQPQQ TRFRDLFNRR 
HFPFVLFVAA IWTCQVIPMF AIYTFGPQIV GLLGLGVGKN AALGNVVISL FFMLGCIPPM 
LWLNTAGRRP LLIGSFAMMT LALAVLGLIP DMGIWLVVMA FAVYAFFSGG PGNLQWLYPN 
ELFPTDIRAS AVGVIMSLSR IGTIVSTWAL PIFINNYGIS NTMLMGAGIS LFGLLISVAF 
APETRGMSLA QTSNMTIRGQ RMG