Gene ECH74115_0480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0480
Symbol	malZ
ID	6967572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	488084
End bp	489898
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	55%
IMG OID	643384528
Product	maltodextrin glucosidase
Protein accession	YP_002269042
Protein GI	209395918
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAATG CATGGCACCT GCCGGTGCCC CCATTTGTTA AACAAAGCAA AGATCAACTG 
CTCATTACAC TGTGGCTGAC GGGCGAAGAC CCACCGCAGC GCATTATGCT GCGTACAGAA 
CACGATAACG AAGAAATGTC AGTACCAATG CATAAGCAGC GCAGTCAGCC GCAGCCAGGC 
GTCACCGCAT GGCGTGCGGC GATTGATCTC TCCAGCGGAC AACCCCGGCG GCGTTACAGT 
TTCAAACTGC TGTGGCACGA TCGCCAGCGT TGGTTTACAC CGCAGGGCTT CAGCCGAATG 
CCGCCGGCAC GACTGGAGCA GTTTGCCGTC GATGTACCGG ATATCGGCCC ACAATGGGCT 
GCGGATCAGA TTTTTTATCA GATCTTCCCT GATCGTTTTG CGCGTAGTCT TCCTCGTGAA 
GCTGAACAGG ATCATGTCTA TTACCATCAT GCAGCCGGAC AAGAGATCAT CTTGCGTGAC 
TGGGATGAAC CGGTCACGGC GCAGGCGGGC GGATCAACGT TCTATGGCGG CGATCTGGAC 
GGGATAAGCG AAAAACTGCC GTATCTGAAA AAGCTTGGCG TGACGGCGCT GTATCTCAAT 
CCGGTGTTTA AAGCTCCCAG CGTACATAAA TACGATACCG AGGATTATCG CCATGTCGAT 
CCGCAGTTTG GCGGTGATGG GGCGTTGCTG CGCTTACGCC ACAATACGCA GCAGCTGGGA 
ATGCGGCTGG TGCTGGATGG CGTGTTTAAC CACAGTGGCG ATTCCCATGC CTGGTTTGAC 
AGGCACAATC GTGGCACGGG GGGAGCTTGT CACAACCCCG AATCGCCCTG GCGCGACTGG 
TACTCGTTTA GTGATGATGG CACGGCGCTC GACTGGCTTG GCTATGCCAG CTTGCCGAAG 
CTGGATTATC AGTCGGAAAG TCTGGTGAAT GAAATTTATC GCGGGGAAGA CAGTATTGTC 
CGCCACTGGC TGAAAGCGCC GTGGAATATG GACGGCTGGC GGCTGGATGT GGTGCATATG 
CTGGGGGAAG CGGGTGGGGC GCGCAATAAT TTGCAGCACG TTGCTGGGAT CACCGAAGCG 
GCGAAAGAAA CCCAGCCGGA AGCGTATATA GTTGGAGAGC ATTTTGGCGA TGCACGGCAA 
TGGTTACAGG CCGATGTGGA AGATGCCGCC ATGAACTATC GCGGCTTCAC ATTCCCGTTG 
TGGGGATTTC TTGCCAATAC CGACATCTCT TACGATCCGC AGCAAATTGA CGCTCAAACC 
TGTATGGCCT GGATGGATAA TTACCGCGCA GGGCTTTCTC ATCAACAGCA ATTACGTATG 
TTTAATCAGC TCGACAGCCA CGATACTGCG CGATTTAAAA CGCTGCTCGG TCGGGAGGTT 
GCGCGCCTGC CCCTGGCAGT GGTCTGGCTG TTCACCTGGC CTGGTGTACC GTGCATTTAT 
TACGGTGATG AAGTGGGACT GGATGGCAAA AATGATCCGT TTTGCCGTAA GCCGTTCCCC 
TGGCAGGTGG AAAAACAGGA TATGGCGTTA TTCGCGTTGT ACCAGCGAAT GATTGCGCTG 
CGTAAGAAAA GTCAGGCGCT GCGTCGTGGC GGCTGTCAGG TGCTGTATGC GGAAGATAAC 
GTGGTGGTAT TTGTCCGCGT GCTGAATCAG CAGCGTGTAC TGGTGGCAAT TAACCGTGGC 
GAAGCCTGTG AAGTGGTGCT ACCCGCGTCA CCGTTTCTTA ATGTCGTGCA ATGGCAACGC 
AAAGAAGGCC ATGGGCAACT GACAGACGGG ATTCTGGCTT TGCCTGCCAT TTCGGCTACG 
GTGTGGATGA ACTAA

Protein sequence

MLNAWHLPVP PFVKQSKDQL LITLWLTGED PPQRIMLRTE HDNEEMSVPM HKQRSQPQPG 
VTAWRAAIDL SSGQPRRRYS FKLLWHDRQR WFTPQGFSRM PPARLEQFAV DVPDIGPQWA 
ADQIFYQIFP DRFARSLPRE AEQDHVYYHH AAGQEIILRD WDEPVTAQAG GSTFYGGDLD 
GISEKLPYLK KLGVTALYLN PVFKAPSVHK YDTEDYRHVD PQFGGDGALL RLRHNTQQLG 
MRLVLDGVFN HSGDSHAWFD RHNRGTGGAC HNPESPWRDW YSFSDDGTAL DWLGYASLPK 
LDYQSESLVN EIYRGEDSIV RHWLKAPWNM DGWRLDVVHM LGEAGGARNN LQHVAGITEA 
AKETQPEAYI VGEHFGDARQ WLQADVEDAA MNYRGFTFPL WGFLANTDIS YDPQQIDAQT 
CMAWMDNYRA GLSHQQQLRM FNQLDSHDTA RFKTLLGREV ARLPLAVVWL FTWPGVPCIY 
YGDEVGLDGK NDPFCRKPFP WQVEKQDMAL FALYQRMIAL RKKSQALRRG GCQVLYAEDN 
VVVFVRVLNQ QRVLVAINRG EACEVVLPAS PFLNVVQWQR KEGHGQLTDG ILALPAISAT 
VWMN