Gene ECH74115_1487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1487
Symbol	nagZ
ID	6966682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1466793
End bp	1467818
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	53%
IMG OID	643385458
Product	beta-hexosaminidase
Protein accession	YP_002269952
Protein GI	209396392
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.0018641
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGGTCCAG TAATGTTGGA TGTCGAAGGT TACGAACTGG ACGCGGAAGA GCGTGAAATA 
CTGGCGCATC CGCTGGTGGG AGGGCTGATT CTCTTTACGC GAAACTATCA TGATCCTGCC 
CAGTTGCGTG AACTGGTGCG CCAGATCCGC GCAGCATCGC GCAATCATCT GGTGGTGGCG 
GTAGATCAGG AAGGTGGACG CGTCCAGCGT TTTCGCGAAG GTTTTACCCG CTTACCGGCA 
GCACAATCCT TTGCTGCGCT GTTGGGAATG GAAGAGGGCG GCAAACTGGC GCAAGAGGCG 
GGTTGGCTGA TGGCCAGCGA AATGATCGCT ATGGATATTG ATATCAGCTT TGCGCCAGTG 
CTGGATGTAG GACATATCAG CGCGGCGATT GGCGAGCGTT CTTATCATGC CGACCCAGAA 
AAAGCCCTGG CAATCGCCAG TCGGTTTATT GATGGGATGC ATGAAGCCGG AATGAAAACG 
ACCGGGAAAC ACTTCCCAGG ACACGGTGCA GTAACTGCAG ATTCACACAA AGAGACGCCG 
TGCGACCCAC GCCCGCAAGC GGAAATTCGT GCCAAAGATA TGTCGGTTTT CAGCACGTTA 
ATCCGCGAAA ATAAACTCGA CGCCATTATG CCTGCGCATG TGATCTACAG TGATGTTGAT 
CCGCGTCCGG CGAGCGGTTC TTCCTACTGG CTGAAAACCG TTTTGCGTCA GGAACTGGGT 
TTTGACGGCG TGATTTTCTC TGACGATTTA TCGATGGAAG GTGCCGCGAT TATGGGCAGT 
TATGCCGAAC GCGGGCAGGT ATCACTGGAT GCGGGTTGCG ATATGATCCT GGTCTGCAAT 
AATCGTAAAG GGGCCGTCAG CGTGTTAGAT AATCTGTCAC CGATCAAGGC AGAACGTGTT 
ACACGTTTGT ATCATAAAGG TTCATTTTCG CGACAGGAAC TGATGGACTC GGCTCGCTGG 
AAAGCGATCA GCGCCCGTCT GAATCAGTTA CATGAACGCT GGCAGGAAGA GAAAGCAGGT 
CACTAA

Protein sequence

MGPVMLDVEG YELDAEEREI LAHPLVGGLI LFTRNYHDPA QLRELVRQIR AASRNHLVVA 
VDQEGGRVQR FREGFTRLPA AQSFAALLGM EEGGKLAQEA GWLMASEMIA MDIDISFAPV 
LDVGHISAAI GERSYHADPE KALAIASRFI DGMHEAGMKT TGKHFPGHGA VTADSHKETP 
CDPRPQAEIR AKDMSVFSTL IRENKLDAIM PAHVIYSDVD PRPASGSSYW LKTVLRQELG 
FDGVIFSDDL SMEGAAIMGS YAERGQVSLD AGCDMILVCN NRKGAVSVLD NLSPIKAERV 
TRLYHKGSFS RQELMDSARW KAISARLNQL HERWQEEKAG H