Gene ECH74115_5165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5165
Symbol	glmS
ID	6971713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4808379
End bp	4810208
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	54%
IMG OID	643388831
Product	glucosamine--fructose-6-phosphate aminotransferase
Protein accession	YP_002273257
Protein GI	209397586
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0449] Glucosamine 6-phosphate synthetase, contains amidotransferase and phosphosugar isomerase domains
TIGRFAM ID	[TIGR01135] glucosamine--fructose-6-phosphate aminotransferase (isomerizing)

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.212663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTGGAA TTGTTGGCGC GATCGCGCAA CGTGATGTAG CAGAAATCCT TCTTGAAGGT 
TTACGTCGTC TGGAATACCG CGGATATGAC TCTGCCGGTC TGGCCGTTGT TGATGCGGAA 
GGTCATATGA CCCGCCTGCG TCGCCTCGGT AAAGTCCAGA TGCTGGCTCA GGCAGCGGAA 
GAACATCCTC TGCATGGCGG CACCGGTATT GCTCACACTC GCTGGGCGAC CCACGGTGAA 
CCTTCAGAAG TGAATGCGCA TCCGCATGTT TCTGAACACA TTGTGGTGGT GCATAACGGC 
ATCATCGAAA ACCATGAACC GCTGCGCGAA GAGTTAAAAG CGCGTGGCTA TACCTTCGTT 
TCTGAAACCG ACACCGAAGT GATTGCCCAT CTGGTGAACT GGGAGCTGAA ACAGGGCGGT 
ACTCTGCGTG AGGCTGTTCT GCGTGCTATC CCGCAACTGC GTGGTGCGTA CGGTACAGTG 
ATCATGGACT CCCGTCACCC GGATACCCTG CTGGCAGCAC GTTCTGGTAG TCCGCTGGTG 
ATTGGTCTGG GTATGGGTGA AAACTTTATC GCTTCTGACC AGCTGGCGCT GCTGCCGGTG 
ACCCGTCGCT TTATCTTCCT TGAAGAGGGC GATATTGCGG AAATCACTCG CCGTTCGGTA 
AACATCTTCG ATAAAACTGG CGCGGAAGTA AAACGTCAGG ATATCGAATC CAATCTGCAA 
TATGACGCGG GCGATAAAGG TATTTACCGT CACTACATGC AGAAAGAGAT CTACGAACAG 
CCGAACGCGA TCAAAAACAC CCTTACCGGG CGCATCAGCC ACGGTCAGGT TGATTTAAGC 
GAGCTGGGAC CGAACGCCGA CGAACTGCTG TCGAAGGTTG AGCATATTCA GATCCTCGCC 
TGTGGTACTT CTTATAACTC CGGTATGGTT TCCCGTTACT GGTTTGAATC GCTGGCAGGT 
ATTCCGTGCG ACGTCGAAAT CGCCTCTGAA TTCCGCTATC GTAAATCTGC CGTGCGTCGT 
AACAGCCTGA TGATCACCTT GTCACAGTCT GGCGAAACCG CGGATACCCT GGCGGGCCTG 
CGTCTGTCGA AAGAGCTGGG TTACCTTGGT TCGCTGGCAA TCTGTAACGT TCCGGGTTCT 
TCTCTGGTGC GCGAATCCGA TCTGGCGCTG ATGACCAACG CGGGTACGGA AATCGGCGTG 
GCATCCACTA AAGCATTCAC CACTCAGTTA ACTGTGCTGT TGATGCTGGT GGCGAAGCTG 
TCTCGCCTGA AAGGTCTGGA TGCCTCCATT GAACATGACA TTGTGCATGG TCTGCAGGCG 
CTGCCGAGCC GTATTGAGCA GATGCTGTCT CAGGACAAAC GCATTGAAGC TCTGGCAGAA 
GATTTCTCTG ACAAACATCA CGCGCTGTTC CTGGGCCGTG GCGATCAGTA CCCAATCGCG 
CTGGAAGGCG CATTGAAGCT GAAAGAGATC TCTTATATTC ACGCTGAAGC CTACGCTGCA 
GGCGAACTGA AACACGGTCC GCTGGCGCTG ATTGACGCCG ATATGCCGGT TATCGTCGTT 
GCGCCGAACA ACGAATTGCT GGAAAAACTG AAATCCAACA TTGAAGAAGT TCGCGCGCGT 
GGCGGCCAAT TGTATGTTTT CGCCGAGCAG GATGCGGGTT TTGTAAGTAG CGATAACATG 
CACATCATCG AGATGCCGCA TGTGGAAGAG GTGATTGCAC CGATCTTCTA CACCGTTCCG 
CTGCAGTTAC TGGCTTATCA CGTCGCGCTG ATCAAAGGCA CCGACGTTGA CCAGCCGCGT 
AACCTGGCAA AATCGGTAAC GGTTGAGTAA

Protein sequence

MCGIVGAIAQ RDVAEILLEG LRRLEYRGYD SAGLAVVDAE GHMTRLRRLG KVQMLAQAAE 
EHPLHGGTGI AHTRWATHGE PSEVNAHPHV SEHIVVVHNG IIENHEPLRE ELKARGYTFV 
SETDTEVIAH LVNWELKQGG TLREAVLRAI PQLRGAYGTV IMDSRHPDTL LAARSGSPLV 
IGLGMGENFI ASDQLALLPV TRRFIFLEEG DIAEITRRSV NIFDKTGAEV KRQDIESNLQ 
YDAGDKGIYR HYMQKEIYEQ PNAIKNTLTG RISHGQVDLS ELGPNADELL SKVEHIQILA 
CGTSYNSGMV SRYWFESLAG IPCDVEIASE FRYRKSAVRR NSLMITLSQS GETADTLAGL 
RLSKELGYLG SLAICNVPGS SLVRESDLAL MTNAGTEIGV ASTKAFTTQL TVLLMLVAKL 
SRLKGLDASI EHDIVHGLQA LPSRIEQMLS QDKRIEALAE DFSDKHHALF LGRGDQYPIA 
LEGALKLKEI SYIHAEAYAA GELKHGPLAL IDADMPVIVV APNNELLEKL KSNIEEVRAR 
GGQLYVFAEQ DAGFVSSDNM HIIEMPHVEE VIAPIFYTVP LQLLAYHVAL IKGTDVDQPR 
NLAKSVTVE