Gene ECD_02997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02997
Symbol	agaZ
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3145107
End bp	3146387
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	55%
IMG OID
Product	tagatose 6-phosphate aldolase 1, kbaZ subunit
Protein accession	ACT44801
Protein GI	253979131
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAACATC TGACAGAAAT GGTGAGACAG CACAAAGCGG GCAAAACAAA TGCAATTTAT 
GCCGTTTGTT CCGCACATCC GCTGGTGCTG GAAGCTGCAA TCCGCTACGC CAGTGCAAAC 
CAAACGCCGT TACTGATTGA AGCAACCTCC AATCAGGTAG ACCAGTTCGG CGGTTATACC 
GGAATGACGC CCGCCGATTT TCGCGGCTTT GTTTGTCAGC TCGCCGACTC GTTGAATTTC 
CCGCAGGATG CGTTGATTCT GGGTGGTGAC CATCTGGGGC CAAACCGCTG GCAAAACCTG 
CCAGCCGCTC AGGCAATGGC CAATGCCGAT GATTTGATTA AAAGCTACGT TGCGGCAGGA 
TTCAAAAAAA TCCACCTTGA TTGCAGCATG TCCTGTCAGG ACGATCCAAT TCCCTTAACT 
GATGACATCG TGGCTGAACG CGCCGCCCGT CTGGCGAAAG TGGCGGAAGA AACCTGTCTT 
GAACACTTTG GCGAAGCCGA TCTGGAGTAT GTCATTGGTA CCGAAGTGCC GGTACCTGGC 
GGCGCGCATG AAACCTTAAG CGAGCTGGCG GTCACCACGC CGGATGCCGC CCGCGCCACG 
CTGGAAGCCC ATCGTCACGC CTTTGAAAAG CAAGGTTTGA ATGCCATCTG GCCACGCATC 
ATTGCCCTGG TGGTTCAACC CGGCGTCGAA TTCGATCACA CCAACGTTAT TGATTATCAG 
CCCGCCAAAG CGAGCGCCTT AAGCCAGATG GTCGAAAACT ACGAAACGCT GATTTTCGAA 
GCGCACTCTA CCGATTATCA AACGCCGCAA TCGCTGCGCC AGCTGGTGAT TGACCACTTT 
GCCATTCTGA AAGTTGGCCC AGCGCTGACC TTCGCCCTGC GTGAAGCTCT GTTCTCTCTG 
GCGGCGATTG AAGAAGAACT GGTGCCAGCG AAAGCCTGTT CTGGTCTGCG TCAGGTGCTG 
GAAGACGTGA TGCTCGACCG CCCGGAATAC TGGCAAAGCC ACTACCACGG TGACGGCAAC 
GCGCGTCGTC TGGCGCGTGG TTATAGCTAC TCGGATCGCG TGCGCTATTA CTGGCCGGAC 
AGCCAGATTG ATGACGCTTT CGCTCATCTG GTACGTAATC TGGCGGATTC ACCAATTCCG 
CTGCCGCTGA TCAGCCAGTA TCTGCCGCTG CAGTACGTGA AAGTTCGCTC CGGCGAGCTG 
CAGCCAACGC CACGGGAACT CATTATCAAC CATATTCAGG ACATCCTGGC GCAGTACCAC 
ACAGCCTGTG AAGGCCAATA A

Protein sequence

MKHLTEMVRQ HKAGKTNAIY AVCSAHPLVL EAAIRYASAN QTPLLIEATS NQVDQFGGYT 
GMTPADFRGF VCQLADSLNF PQDALILGGD HLGPNRWQNL PAAQAMANAD DLIKSYVAAG 
FKKIHLDCSM SCQDDPIPLT DDIVAERAAR LAKVAEETCL EHFGEADLEY VIGTEVPVPG 
GAHETLSELA VTTPDAARAT LEAHRHAFEK QGLNAIWPRI IALVVQPGVE FDHTNVIDYQ 
PAKASALSQM VENYETLIFE AHSTDYQTPQ SLRQLVIDHF AILKVGPALT FALREALFSL 
AAIEEELVPA KACSGLRQVL EDVMLDRPEY WQSHYHGDGN ARRLARGYSY SDRVRYYWPD 
SQIDDAFAHL VRNLADSPIP LPLISQYLPL QYVKVRSGEL QPTPRELIIN HIQDILAQYH 
TACEGQ