Gene B21_01758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01758
Symbol	yeaU
ID	8113708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	1826954
End bp	1828039
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	54%
IMG OID	644847979
Product	hypothetical protein
Protein accession	YP_002999552
Protein GI	251785248
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR02089] tartrate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.241519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAA CGATGCGTAT TGCTGCGATC CCGGGAGACG GGATTGGCAA AGAAGTCCTT 
CCTGAAGGGA TTCGCGTGTT ACAGGCTGCC GCTGAGCGCT GGGGCTTCGC CTTGAGTTTT 
GAGCAAATGG AGTGGGCGAG CTGCGAGTAT TACAGCCATC ACGGTAAAAT GATGCCGGAC 
GACTGGCATG AGCAACTTAG CCGTTTCGAC GCCATCTATT TTGGTGCCGT CGGCTGGCCG 
GATACCGTTC CGGACCATAT TTCGTTGTGG GGTTCGCTGC TGAAATTTCG TCGTGAATTC 
GACCAGTACG TCAACCTGCG CCCGGTTCGT CTCTTTCCTG GCGTTCCCTG CCCGCTGGCG 
GGAAAACAGC CTGGCGACAT CGATTTTTAC GTGGTCAGGG AAAACACCGA AGGCGAATAT 
TCCTCGCTCG GCGGTAGAGT GAATGAAGGT ACAGAGCATG AAGTCGTCAT TCAGGAATCG 
GTATTTACGC GTCGTGGTGT CGATCGCATT TTGCGTTATG CCTTCGAACT TGCGCAAAGC 
CGCCCACGTA AGACGCTAAC TTCTGCCACT AAATCGAACG GTTTAGCCAT CAGCATGCCG 
TACTGGGATG AGCGAGTGGA AGCAATGGCC GAGAATTACC CGGAGATCCG CTGGGACAAG 
CAGCATATTG ATATTCTCTG CGCGCGTTTT GTGATGCAGC CGGAACGATT CGATGTGGTG 
GTGGCGTCCA ATTTGTTTGG CGATATCCTT TCCGATCTTG GCCCGGCCTG CATCGGCACC 
ATTGGCATTG CCCCATCCGC CAACCTGAAT CCGGAACGCA CTTTCCCGTC GCTCTTCGAG 
CCTGTCCACG GTTCCGCGCC GGATATCTAC GGGAAAAATA TTGCTAACCC TATCGCCACG 
ATTTGGGCCG GGGCAATGAT GCTCGATTTT CTCGGCAATG GCGATGAGCG TTTCCAGCAA 
GCGCATAACG GTATTCTGGC AGCAATTGAA GAAGTGATTG CTCACGGGCC GAAAACACCT 
GATATGAAAG GCAATGCCAC CACGCCACAG GTTGCCGACG CGATTTGCAA AATTATTTTG 
CGTTAA

Protein sequence

MMKTMRIAAI PGDGIGKEVL PEGIRVLQAA AERWGFALSF EQMEWASCEY YSHHGKMMPD 
DWHEQLSRFD AIYFGAVGWP DTVPDHISLW GSLLKFRREF DQYVNLRPVR LFPGVPCPLA 
GKQPGDIDFY VVRENTEGEY SSLGGRVNEG TEHEVVIQES VFTRRGVDRI LRYAFELAQS 
RPRKTLTSAT KSNGLAISMP YWDERVEAMA ENYPEIRWDK QHIDILCARF VMQPERFDVV 
VASNLFGDIL SDLGPACIGT IGIAPSANLN PERTFPSLFE PVHGSAPDIY GKNIANPIAT 
IWAGAMMLDF LGNGDERFQQ AHNGILAAIE EVIAHGPKTP DMKGNATTPQ VADAICKIIL 
R