Gene ECH74115_0287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0287
Symbol	proB
ID	6970410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	300060
End bp	301163
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	56%
IMG OID	643384353
Product	gamma-glutamyl kinase
Protein accession	YP_002268869
Protein GI	209398531
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0263] Glutamate 5-kinase
TIGRFAM ID	[TIGR01027] glutamate 5-kinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.406641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.77952
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACA GCCAGACGCT GGTGGTAAAA CTCGGCACCA GTGTGCTAAC AGGCGGATCG 
CGCCGCCTGA ACCGTGCCCA TATCGTTGAA CTTGTTCGCC AGTGCGCGCA GTTACATGCC 
GCCGGGCATC GGATTGTTAT TGTGACGTCG GGCGCGATCG CCGCCGGACG TGAGCACCTG 
GGTTACCCGG AACTGCCAGC GACTATCGCC TCGAAACAAC TGCTGGCGGC GGTAGGGCAG 
AGTCGACTGA TTCAACTGTG GGAACAGCTG TTTTCGATTT ATGGCATTCA CGTCGGGCAA 
ATGCTGCTGA CTCGTGCTGA TATGGAAGAC CGTGAACGCT TCCTGAACGC CCGCGACACC 
CTGCGTGCGT TGCTCGATAA CAATATCGTT CCGGTAATCA ATGAGAACGA TGCTGTCGCT 
ACGGCAGAGA TTAAAGTCGG CGATAACGAC AACCTTTCTG CACTGGCGGC GATTCTGGCG 
GGTGCCGATA AACTGTTGTT ACTGACCGAT CAAAAAGGTT TGTATACCGC TGACCCGCGC 
AGCAATCCGC AGGCAGAACT GATTAAAGAT GTTTACGGCA TTGATGACGC ACTGCGCGCG 
ATTGCTGGTG ACAGCGTTTC AGGCCTCGGA ACTGGCGGCA TGAGTACCAA ATTGCAGGCC 
GCTGACGTGG CTTGCCGTGC GGGTATCGAC ACCATTATTG CCGCGGGCAG CAAGCCGGGC 
GTTATTGGTG ATGTGATGGA AGGCATTTCC GTCGGTACGC TGTTCCATGC CCAGGCGACT 
CCGCTTGAAA ACCGTAAACG CTGGATTTTC GGTGCGCCGC CTGCGGGTGA AATCACGGTA 
GATGAAGGGG CAACCGCCGC CATTCTTGAA CGCGGCAGCT CCCTGTTGCC GAAAGGCATT 
AAAAGCGTGA CTGGCAACTT CTCGCGTGGT GAAGTCATCC GCATTTGTAA CCTCGAAGGT 
CGCGATATCG CCCACGGCGT CAGTCGTTAC AACAGCGATG CATTACGCCG TATTGCCGGA 
CACCACTCGC AAGAAATTGA TGCAATACTG GGATATGAAT ACGGCCCGGT TGCCGTTCAC 
CGTGATGACA TGATCACCCG TTAA

Protein sequence

MSDSQTLVVK LGTSVLTGGS RRLNRAHIVE LVRQCAQLHA AGHRIVIVTS GAIAAGREHL 
GYPELPATIA SKQLLAAVGQ SRLIQLWEQL FSIYGIHVGQ MLLTRADMED RERFLNARDT 
LRALLDNNIV PVINENDAVA TAEIKVGDND NLSALAAILA GADKLLLLTD QKGLYTADPR 
SNPQAELIKD VYGIDDALRA IAGDSVSGLG TGGMSTKLQA ADVACRAGID TIIAAGSKPG 
VIGDVMEGIS VGTLFHAQAT PLENRKRWIF GAPPAGEITV DEGATAAILE RGSSLLPKGI 
KSVTGNFSRG EVIRICNLEG RDIAHGVSRY NSDALRRIAG HHSQEIDAIL GYEYGPVAVH 
RDDMITR