Gene ECH74115_3781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3781
Symbol
ID	6967636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3503002
End bp	3503985
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	46%
IMG OID	643387568
Product	sugar ABC transporter, periplasmic sugar-binding protein
Protein accession	YP_002272021
Protein GI	209396140
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAAAA AAATGAGAAC AACCCGTAAT CTATTATTAA TGGCTACGCT ATTAGGTAGC 
GCACTATTTG CCAGAGCTGC GGATAAAGAA ATGACCATTG GCGCAATATA CCTTGATACT 
CAGGGATATT ACGCTGGAGT GCGTCAGGGA GTTCAGGATG CGGCAAAAGA TTCTTCAGTA 
CAGGTACAGT TAATTGAAAC TAACGCCCAG GGTGATATTT CGAAAGAAAG TACCTTTGTT 
GATACCCTCG TGGCGCGTAA TGTCGATGCT ATTATTTTAT CGGCAGTGTC TGAAAATGGC 
AGTAGCCGTA CCGTTCGTCG CGCCAGTGAA GCGGGTATTC CGGTGATTTG CTACAACACC 
TGTATTAATC AAAAGGGGGT CGATAAATAT GTCTCGGCGT ATCTGGTGGG TGACCCGCTG 
GAATTTGGTA AAAAACTGGG TAACGCTGCC GCCGATTATT TTATTGCCAA TAAAATTGAC 
CAGCCGAAAA TTGCCGTCAT CAATTGCGAA GCCTTTGAAG TTTGTGTGCA GCGACGTAAA 
GGATTTGAAG AAGTATTAAA ATCCCGCGTT CCCGGCGCGC AAATTGTCGC TAATCAGGAA 
GGGACTGTTT TAGATAAAGC GATTTCCGTT GGTGAAAAAC TGATTATCTC CACGCCGGAT 
CTCAACGCCA TTATGGGGGA ATCGGGCGGT GCGACACTCG GTGCGGTAAA AGCGGTACGT 
AATCAAAATC AGGCCGGAAA AATTGCTGTT TTCGGTTCGG ATATGACAAC CGAAATTGCT 
CAGGAGCTGG AAAACAATCA GGTGCTGAAA GCGGTAGTGG ATATTTCCGG TAAGAAAATG 
GGCAATGCTG TTTTCGCGCA AACATTGAAG GTTATCAATA AACAAGCCGA CGGTGAAAAA 
GTGATTCAGG TGCCTATCGA TCTCTATACC AAAACGGAAG ACGGTAAACA GTGGCTGGCA 
ACGCACGTTG ATGGTCTGCC CTAA

Protein sequence

MPKKMRTTRN LLLMATLLGS ALFARAADKE MTIGAIYLDT QGYYAGVRQG VQDAAKDSSV 
QVQLIETNAQ GDISKESTFV DTLVARNVDA IILSAVSENG SSRTVRRASE AGIPVICYNT 
CINQKGVDKY VSAYLVGDPL EFGKKLGNAA ADYFIANKID QPKIAVINCE AFEVCVQRRK 
GFEEVLKSRV PGAQIVANQE GTVLDKAISV GEKLIISTPD LNAIMGESGG ATLGAVKAVR 
NQNQAGKIAV FGSDMTTEIA QELENNQVLK AVVDISGKKM GNAVFAQTLK VINKQADGEK 
VIQVPIDLYT KTEDGKQWLA THVDGLP