Gene EcSMS35_0296 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0296
Symbol	proB
ID	6145427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	304156
End bp	305259
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	56%
IMG OID	641615193
Product	gamma-glutamyl kinase
Protein accession	YP_001742402
Protein GI	170681970
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0263] Glutamate 5-kinase
TIGRFAM ID	[TIGR01027] glutamate 5-kinase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.00410823
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTGACA GCCAGACGCT GGTGGTAAAA CTCGGCACCA GTGTGCTAAC AGGCGGATCG 
CGCCGTCTGA ACCGTGCCCA TATCGTTGAA CTTGTTCGCC AGTGCGCGCA GTTACATGCC 
GCCGGGCATC GGATTGTTAT TGTGACGTCG GGCGCGATCG CCGCCGGACG TGAGCACCTG 
GGTTACCCGG AACTGCCAGC GACTATCGCC TCGAAACAAC TGCTGGCGGC GGTAGGGCAG 
AGTCGACTGA TTCAACTATG GGAACAGCTG TTTTCTATTT ATGGCATTCA CGTCGGGCAA 
ATGCTGCTGA CCCGTGCTGA TATGGAAGAC CGTGAACGCT TCCTGAACGC CCGCGACACC 
TTGCGTGCGT TGCTCGATAA CAATATCGTT CCGGTAATCA ATGAGAACGA TGCTGTCGCT 
ACTGCAGAGA TTAAGGTCGG TGATAACGAT AACCTTTCTG CGCTGGCGGC GATTCTGGCG 
GGTGCCGATA AACTGTTGCT GCTGACCGAT CAAAAAGGTT TGTACACCGC TGACCCGCGC 
AGCAATCCGC AGGCAGAACT GATTAAAGAT GTTTACGGCA TTGATGACGC ACTGCGCGCG 
ATTGCCGGTG ACAGCGTTTC AGGCCTCGGA ACTGGCGGCA TGAGTACCAA ATTGCAGGCC 
GCGGACGTGG CTTGCCGTGC GGGTATCGAC ACCATTATTG CCGCGGGCAG CAAGCCGGGC 
GTTATTGGTG ATGTGATGGA AGGCATTTCC GTGGGTACGC TGTTCCATGC CCAGGCGACT 
CCGCTTGAAA ACCGTAAACG CTGGATTTTC GGTGCGCCGC CGGCGGGTGA AATCACGGTA 
GATGAAGGGG CAACTGCCGC CATTCTTGAA CGCGGCAGCT CCCTGTTGCC GAAAGGGATT 
AAAAGCGTGA CTGGCAATTT CTCGCGTGGT GAAGTCATCC GCATTTGCAA CCTCGAAGGT 
CGCGATATCG CCCACGGTGT CAGTCGTTAC AACAGCGATG CATTACGCCG TATTGCCGGA 
CACCACTCGC AAGAAATTGA TGCAATACTG GGATATGAAT ACGGCCCGGT TGCCGTTCAC 
CGTGATGACA TGATTACCCG TTAA

Protein sequence

MSDSQTLVVK LGTSVLTGGS RRLNRAHIVE LVRQCAQLHA AGHRIVIVTS GAIAAGREHL 
GYPELPATIA SKQLLAAVGQ SRLIQLWEQL FSIYGIHVGQ MLLTRADMED RERFLNARDT 
LRALLDNNIV PVINENDAVA TAEIKVGDND NLSALAAILA GADKLLLLTD QKGLYTADPR 
SNPQAELIKD VYGIDDALRA IAGDSVSGLG TGGMSTKLQA ADVACRAGID TIIAAGSKPG 
VIGDVMEGIS VGTLFHAQAT PLENRKRWIF GAPPAGEITV DEGATAAILE RGSSLLPKGI 
KSVTGNFSRG EVIRICNLEG RDIAHGVSRY NSDALRRIAG HHSQEIDAIL GYEYGPVAVH 
RDDMITR