Gene EcHS_A0269 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0269
Symbol	proB
ID	5593207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	289258
End bp	290361
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	56%
IMG OID	640919455
Product	gamma-glutamyl kinase
Protein accession	YP_001457042
Protein GI	157159724
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0263] Glutamate 5-kinase
TIGRFAM ID	[TIGR01027] glutamate 5-kinase

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACA GCCAGACGCT GGTGGTAAAA CTCGGCACCA GTGTGCTAAC AGGCGGATCG 
CGCCGTCTGA ACCGTGCCCA TATCGTTGAA CTTGTTCGCC AGTGCGCGCA GTTACATGCC 
GCCGGGCATC GGATTGTTAT TGTGACGTCG GGCGCGATCG CCGCCGGACG TGAGCACCTG 
GGTTACCCGG AACTGCCAGC GACTATCGCC TCGAAACAAC TGCTGGCAGC GGTAGGGCAG 
AGTCGACTGA TTCAACTGTG GGAACAGCTG TTTTCGATTT ATGGCATTCA CGTCGGGCAA 
ATGCTGCTGA CCCGTGCTGA TATGGAAGAC CGTGAACGCT TCCTGAACGC CCGCGACACC 
CTGCGTGCGT TGCTCGATAA CAATATCGTT CCGGTAATCA ATGAGAACGA TGCTGTCGCT 
ACGGCAGAGA TTAAAGTCGG CGATAACGAT AACCTTTCTG CGCTGGCGGC GATTCTGGCG 
GGTGCCGATA AACTGTTGCT GCTGACCGAT CAAAAAGGTT TGTATACCGC TGACCCGCGC 
AGCAATCCGC AGGCAGAACT GATTAAAGAT GTTTACGGCA TTGATGACGC ACTGCGCGCG 
ATTGCCGGTG ACAGCGTTTC AGGCCTCGGA ACTGGCGGCA TGAGTACCAA ATTGCAGGCC 
GCTGACGTGG CTTGCCGTGC GGGTATCGAC ACCATTATTG CCGCGGGCAG CAAGCCGGGC 
GTTATTGGTG ATGTGATGGA AGGCATTTCC GTCGGTACGC TGTTCCATGC CCAGGCGACT 
CCGCTTGAAA ACCGTAAACG CTGGATTTTC GGTGCGCCGC CGGCGGGTGA AATCACGGTA 
GATGAAGGGG CAACTGCCGC CATTCTTGAA CGCGGCAGCT CCCTGTTGCC GAAAGGCATT 
AAAAGCGTGA CTGGCAATTT CTCGCGTGGT GAAGTCATCC GCATTTGCAA CCTCGAAGGT 
CGCGATATCG CCCACGGCGT CAGTCGTTAC AACAGCGATG CATTACGCCG TATTGCCGGG 
CACCACTCGC AAGAAATTGA TGCAATACTG GGATATGAAT ACGGCCCGGT TGCCGTTCAC 
CGTGATGACA TGATTACCCG TTAA

Protein sequence

MSDSQTLVVK LGTSVLTGGS RRLNRAHIVE LVRQCAQLHA AGHRIVIVTS GAIAAGREHL 
GYPELPATIA SKQLLAAVGQ SRLIQLWEQL FSIYGIHVGQ MLLTRADMED RERFLNARDT 
LRALLDNNIV PVINENDAVA TAEIKVGDND NLSALAAILA GADKLLLLTD QKGLYTADPR 
SNPQAELIKD VYGIDDALRA IAGDSVSGLG TGGMSTKLQA ADVACRAGID TIIAAGSKPG 
VIGDVMEGIS VGTLFHAQAT PLENRKRWIF GAPPAGEITV DEGATAAILE RGSSLLPKGI 
KSVTGNFSRG EVIRICNLEG RDIAHGVSRY NSDALRRIAG HHSQEIDAIL GYEYGPVAVH 
RDDMITR