Gene ECD_02341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02341
Symbol	eutB
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	2428498
End bp	2429859
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	56%
IMG OID
Product	ethanolamine ammonia-lyase, large subunit, heavy chain
Protein accession	ACT44162
Protein GI	253978492
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTAA AGACCACATT GTTCGGCAAT GTATATCAGT TTAAGGATGT AAAAGAGGTG 
CTGGCTAAAG CCAACGAACT GCGTTCGGGG GATGTGCTGG CGGGCGTCGC AGCGGCAAGC 
TCACAGGAGC GCGTGGCGGC AAAGCAGGTG TTGTCGGAAA TGACCGTAGC GGACATCCGC 
AATAATCCGG TGATTGCCTA TGAAGATGAC TGCGTGACGC GGCTGATTCA GGACGATGTT 
AACGAAACGG CCTACAACCA GATTAAAAAC TGGAGCATCA GCGAACTGCG TGAGTATGTG 
CTGAGCGATG AAACCAGCGT GGACGACATT GCCTTTACCC GCAAAGGGCT GACCTCGGAA 
GTGGTCGCGG CGGTAGCGAA GATTTGCTCC AACGCGGACC TGATCTACGG CGCGAAGAAA 
ATGCCGGTAA TCAAAAAGGC CAATACCACC ATCGGTATTC CGGGCACCTT TAGCGCCCGT 
TTGCAGCCAA ATGACACCCG TGACGACGTG CAAAGTATCG CCGCGCAAAT CTACGAAGGG 
CTTTCCTTCG GGGTGGGCGA TGCGGTGATC GGCGTTAACC CGGTGACTGA CGACGTGGAA 
AACTTAAGCC GCGTGTTGGA TACCATCTAT GGCGTGATCG ACAAATTCAA CATCCCAACT 
CAGGGCTGTG TACTGGCGCA CGTCACCACC CAGATCGAAG CGATCCGTCG TGGCGCACCG 
GGCGGGCTGA TTTTCCAGAG TATCTGTGGC AGCGAAAAAG GGCTGAAAGA GTTTGGCGTG 
GAGCTGGCGA TGCTCGACGA AGCGCGCGCA GTGGGCGCGG AGTTCAACCG TATCGCCGGG 
GAAAACTGCC TCTACTTCGA AACCGGACAA GGCTCTGCGC TATCCGCTGG CGCTAACTTC 
GGCGCAGACC AGGTAACGAT GGAAGCACGT AACTACGGGC TGGCGCGTCA TTACGATCCG 
TTTATCGTCA ACACCGTGGT CGGCTTTATT GGGCCGGAGT ATCTCTACAA CGACCGCCAG 
ATTATCCGTG CTGGCTTAGA AGATCACTTT ATGGGCAAGC TGAGCGGCAT CTCTATGGGC 
TGTGACTGCT GTTATACCAA CCACGCTGAC GCTGACCAGA ACCTCAACGA AAACCTGATG 
ATCCTGCTCG CCACCGCAGG CTGCAACTAC ATCATGGGGA TGCCGCTGGG TGATGACATC 
ATGCTCAACT ACCAGACCAC CGCATTCCAC GATACCGCCA CTGTGCGTCA GTTACTCAAC 
CTGCGCCCGT CACCGGAGTT TGAACGCTGG CTGGAAAGCA TGGGCATTAT GGCAAACGGT 
CGCCTGACCA AACGGGCGGG CGATCCGTCA CTGTTCTTCT GA

Protein sequence

MKLKTTLFGN VYQFKDVKEV LAKANELRSG DVLAGVAAAS SQERVAAKQV LSEMTVADIR 
NNPVIAYEDD CVTRLIQDDV NETAYNQIKN WSISELREYV LSDETSVDDI AFTRKGLTSE 
VVAAVAKICS NADLIYGAKK MPVIKKANTT IGIPGTFSAR LQPNDTRDDV QSIAAQIYEG 
LSFGVGDAVI GVNPVTDDVE NLSRVLDTIY GVIDKFNIPT QGCVLAHVTT QIEAIRRGAP 
GGLIFQSICG SEKGLKEFGV ELAMLDEARA VGAEFNRIAG ENCLYFETGQ GSALSAGANF 
GADQVTMEAR NYGLARHYDP FIVNTVVGFI GPEYLYNDRQ IIRAGLEDHF MGKLSGISMG 
CDCCYTNHAD ADQNLNENLM ILLATAGCNY IMGMPLGDDI MLNYQTTAFH DTATVRQLLN 
LRPSPEFERW LESMGIMANG RLTKRAGDPS LFF