Gene B21_00242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00242
Symbol	proB
ID	8114440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	264876
End bp	265979
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	56%
IMG OID	644846532
Product	hypothetical protein
Protein accession	YP_002998105
Protein GI	251783801
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0263] Glutamate 5-kinase
TIGRFAM ID	[TIGR01027] glutamate 5-kinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACA GCCAGACGCT GGTGGTAAAA CTCGGCACCA GTGTGCTAAC AGGCGGATCG 
CGCCGTCTGA ACCGTGCCCA TATCGTTGAA CTTGTTCGCC AGTGCGCGCA GTTACATGCC 
GCCGGGCATC GGATTGTTAT TGTGACGTCG GGCGCGATCG CCGCCGGACG TGAGCACCTG 
GGTTACCCGG AACTGCCAGC GACTATCGCC TCGAAACAAC TGCTGGCGGC GGTAGGGCAG 
AGTCGACTGA TTCAACTGTG GGAACAGCTG TTTTCGATTT ATGGCATTCA CGTCGGGCAA 
ATGCTGCTGA CCCGTGCTGA TATGGAAGAC CGAGAACGCT TCCTGAACGC CCGCGACACC 
CTGCGTGCGT TGCTCGATAA CAATATCGTT CCGGTAATCA ATGAGAACGA TGCTGTCGCT 
ACGGCAGAGA TTAAGGTCGG CGATAACGAT AACCTTTCTG CGCTGGCGGC GATTCTGGCG 
GGTGCCGATA AACTGTTGCT GCTGACCGAT CAAAAAGGTT TGTATACCGC TGACCCGCGC 
AGCAATCCGC AGGCAGAACT GATTAAAGAT GTTTACGGCA TTGATGACGC ACTGCGCGCG 
ATTGCCGGTG ACAGCGTTTC AGGCCTCGGA ACTGGCGGCA TGAGTACCAA ATTGCAGGCC 
GCTGACGTGG CTTGCCGTGC GGGTATCGAC ACCATTATTG CCGCGGGCAG CAAGCCGGGC 
GTTATTGGTG ATGTGATGGA AGGCATTTCC GTCGGTACGC TGTTCCATGC CCAGGCGACT 
CCGCTTGAAA ACCGTAAACG CTGGATTTTC GGTGCGCCGC CGGCGGGTGA AATCACGGTA 
GATGAAGGGG CAACTGCCGC CATTCTGGAA CGCGGCAGCT CCCTGTTGCC GAAAGGCATT 
AAAAGCGTGA CTGGCAATTT CTCGCGTGGT GAAGTCATCC GCATTTGCAA CCTCGAAGGC 
CGCGATATCG CCCACGGCGT CAGTCGTTAC AACAGCGATG CATTACGCCG TATTGCCGGA 
CACCACTCGC AAGAAATTGA TGCAATACTG GGATATGAAT ACGGCCCGGT TGCCGTTCAC 
CGTGATGACA TGATTACCCG TTAA

Protein sequence

MSDSQTLVVK LGTSVLTGGS RRLNRAHIVE LVRQCAQLHA AGHRIVIVTS GAIAAGREHL 
GYPELPATIA SKQLLAAVGQ SRLIQLWEQL FSIYGIHVGQ MLLTRADMED RERFLNARDT 
LRALLDNNIV PVINENDAVA TAEIKVGDND NLSALAAILA GADKLLLLTD QKGLYTADPR 
SNPQAELIKD VYGIDDALRA IAGDSVSGLG TGGMSTKLQA ADVACRAGID TIIAAGSKPG 
VIGDVMEGIS VGTLFHAQAT PLENRKRWIF GAPPAGEITV DEGATAAILE RGSSLLPKGI 
KSVTGNFSRG EVIRICNLEG RDIAHGVSRY NSDALRRIAG HHSQEIDAIL GYEYGPVAVH 
RDDMITR