Gene B21_00074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_00074
Symbol	leuB
ID	8113596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	83672
End bp	84763
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	55%
IMG OID	644846368
Product	hypothetical protein
Protein accession	YP_002997941
Protein GI	251783637
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAAGA ATTACCATAT TGCCGTATTG CCGGGGGACG GTATTGGTCC GGAAGTGATG 
ACCCAGGCGC TGAAAGTGCT GGATGCCGTG CGCAACCGCT TTGCGATGCG CATCACCACC 
AGCCATTACG ATGTAGGCGG CGCAGCCATT GATAACCACG GGCAACCACT GCCGCCTGCG 
ACGGTTGAAG GTTGTGAGCA AGCCGATGCC GTGCTGTTTG GCTCGGTAGG CGGCCCGAAG 
TGGGAACATT TACCACCAGA CCAGCAACCA GAACGCGGCG CGCTGCTGCC TCTGCGTAAG 
CACTTCAAAT TATTCAGCAA CCTGCGCCCG GCAAAACTGT ATCAGGGGCT GGAAGCATTC 
TGTCCGCTGC GTGCAGACAT TGCCGCAAAC GGCTTCGACA TCCTGTGTGT GCGCGAACTG 
ACCGGCGGCA TCTATTTCGG TCAGCCAAAA GGCCGCGAAG GTAGCGGACA ATATGAAAAA 
GCCTTTGATA CCGAGGTGTA TCACCGTTTT GAGATCGAAC GTATCGCCCG CATCGCGTTT 
GAATCTGCTC GCAAGCGTCG CCACAAAGTG ACGTCGATCG ATAAAGCCAA CGTGCTGCAA 
TCCTCTATTT TATGGCGGGA GATCGTTAAC GAGATCGCCA CGGAATACCC GGATGTCGAA 
CTGGCGCATA TGTACATCGA CAACGCCACC ATGCAGCTGA TTAAAGATCC ATCACAGTTT 
GACGTTCTGC TGTGCTCCAA CCTGTTTGGC GACATTCTGT CTGACGAGTG CGCAATGATC 
ACTGGCTCGA TGGGGATGTT GCCTTCCGCC AGCCTGAACG AGCAAGGTTT TGGACTGTAT 
GAACCGGCGG GCGGCTCGGC ACCAGATATC GCAGGCAAAA ACATCGCCAA CCCGATTGCA 
CAAATCCTTT CGCTGGCACT GCTGCTGCGT TACAGCCTGG ATGCCGATGA TGCGGCTTGC 
GCCATTGAAC GCGCCATTAA CCGCGCATTA GAAGAAGGCA TTCGCACCGG GGATTTAGCC 
CGTGGCGCTG CCGCCGTTAG TACCGATGAA ATGGGCGATA TCATTGCCCG CTATGTAGCA 
GAAGGGGTGT AA

Protein sequence

MSKNYHIAVL PGDGIGPEVM TQALKVLDAV RNRFAMRITT SHYDVGGAAI DNHGQPLPPA 
TVEGCEQADA VLFGSVGGPK WEHLPPDQQP ERGALLPLRK HFKLFSNLRP AKLYQGLEAF 
CPLRADIAAN GFDILCVREL TGGIYFGQPK GREGSGQYEK AFDTEVYHRF EIERIARIAF 
ESARKRRHKV TSIDKANVLQ SSILWREIVN EIATEYPDVE LAHMYIDNAT MQLIKDPSQF 
DVLLCSNLFG DILSDECAMI TGSMGMLPSA SLNEQGFGLY EPAGGSAPDI AGKNIANPIA 
QILSLALLLR YSLDADDAAC AIERAINRAL EEGIRTGDLA RGAAAVSTDE MGDIIARYVA 
EGV