Gene ECH74115_B0112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_B0112
Symbol
ID	6966459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011350
Strand	+
Start bp	71215
End bp	72318
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	51%
IMG OID	643384008
Product	UDP-sugar hydrolase
Protein accession	YP_002268487
Protein GI	209395585
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTT TATTCACTGA ATCTTCGTCA GATATTGGGG GCCAGGAGCT GCAGGCACTG 
GCCCAGATGA CTGCTCTTCA AAAGCAGGGA CATTCCGTTT TACTTGCCTG CAGAGAAAAA 
AGTAAAATTG CTCCGGAAGC CAGAAAAAGA GGGCATGATG TCACTTTTAT TCCTTTCAGG 
AACAGCCTTC ACCTTCCTTC CATCCTCAGA CTTCGACGGA TTATCGGGGA ATTTAAACCT 
GATCTGGTCA TCTGCCATAG TGGCCATGAC AGTAATATAG CAGGACTGAG CCGTCTGATA 
TGCTGTCACC GCTTCAGTAT TGTCAGACAA AAAACCTACA TCACCCGTAA GACCAGAACG 
TTTTCCCTGA ATTATCTGTG TGATTTCATT GTTGTGCCTA GCTCAGCCAT GATGGCGCAT 
CTGATGGCGG AAGGTGTCAG GACACCGGTA ACGGTTATTC CACCGGGTTT CGACTGGCCC 
GCATTGCATA ATGAAGCCAT GCGACCGTTA CCCCTGCATA TCCACGCCTG GGCTGCATCA 
GCAGACAATG TTCCGCTTAT CGTTCAGGTG GGGATGCTAC GTCCCGAAAA AGGACATGAA 
TTTATGCTGC GTGTATTGTA TCAGCTGAAG ATGGAAGGGA AATCATTTCG CTGGCTCGTG 
GTGGGCGCCG GGCGTGAAGA ATACGAAGCA CGTCTGCGTC AGCAGACAGA ACACCTGGGA 
ATGAGCGGAG ATGTGTTAAT GGCAGGTGCC CTTTTCCCAG CGTTACCGGT CTACCGGATT 
GCCAGTGTGG TGGTCATGCC TTCGGAAAAT GAAGCGTTTG GTATGGTACT GGCTGAAGCG 
TCAGTCTCCG GCGTGCCCGT TATCGCCAGT GAGACGGGCG GGATCCCTGA TGTCATTCAG 
AAGAATGTGA CAGGGACGCT GTTACCCGTG GGGGATGTGT CTGCATGGAC CGGCGCACTG 
CGCGATTTTT TATCCCGACC GGAACGCTTC CGGATGATGG CAGCCAGCGC CAGAGAAGAT 
ATTGAGTACC GGTTTGATAT TAACAGAACG GCACAGATCA TTGTGTCTCT GGCTAGTCAG 
GCTAAGGGGA AATGCAACAG ATAA

Protein sequence

MKILFTESSS DIGGQELQAL AQMTALQKQG HSVLLACREK SKIAPEARKR GHDVTFIPFR 
NSLHLPSILR LRRIIGEFKP DLVICHSGHD SNIAGLSRLI CCHRFSIVRQ KTYITRKTRT 
FSLNYLCDFI VVPSSAMMAH LMAEGVRTPV TVIPPGFDWP ALHNEAMRPL PLHIHAWAAS 
ADNVPLIVQV GMLRPEKGHE FMLRVLYQLK MEGKSFRWLV VGAGREEYEA RLRQQTEHLG 
MSGDVLMAGA LFPALPVYRI ASVVVMPSEN EAFGMVLAEA SVSGVPVIAS ETGGIPDVIQ 
KNVTGTLLPV GDVSAWTGAL RDFLSRPERF RMMAASARED IEYRFDINRT AQIIVSLASQ 
AKGKCNR