Gene SeD_A2825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2825
Symbol	eutB
ID	6871044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2693495
End bp	2694856
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	57%
IMG OID	642785878
Product	ethanolamine ammonia-lyase large subunit
Protein accession	YP_002216528
Protein GI	198245031
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4303] Ethanolamine ammonia-lyase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTAA AGACCACATT GTTCGGCAAT GTTTATCAGT TTAAGGATGT AAAAGAGGTA 
CTGGCTAAAG CCAACGAACT GCGTTCGGGG GACGTGCTGG CCGGGGTTGC CGCGGCAAGT 
TCGCAGGAGC GCGTAGCGGC AAAACAGGTA CTGTCGGAAA TGACGGTGGC GGATATCCGC 
AACAATCCGG TGATTGCCTA TGAAGAGGAC TGCGTGACGC GCCTGATTCA GGACGACGTC 
AACGAAACGG CCTATAACCG GATTAAAAAC TGGAGCATCA GCGAACTGCG CGAATACGTA 
CTGAGCGATG AAACCTCCGT GGACGACATC GCGTTTATCC GCAAAGGGCT GACCTCCGAA 
GTGGTGGCGG CAGTAGCGAA AATCTGCTCC AACGCTGACC TGATCTACGG CGGCAAGAAA 
ATGCCGGTGA TCAAAAAAGC CAATACCACT ATCGGTATTC CGGGCACCTT TAGCTGCCGT 
TTGCAGCCGA ACGATACCCG TGACGATGTA CAGAGTATCG CCGCGCAAAT CTACGAAGGG 
CTTTCTTTCG GCGCAGGCGA TGCGGTGATC GGCGTTAACC CGGTGACCGA TGACGTGGAG 
AACCTGACCC GCGTGCTCGA CACCGTTTAC GGCGTTATCG ATAAATTCAA TATTCCGACC 
CAGGGCTGCG TGCTGGCGCA CGTCACCACC CAGATCGAAG CGATTCGTCG CGGCGCGCCG 
GGCGGACTGA TTTTCCAGAG CATTTGCGGC AGCGAGAAGG GCTTAAAAGA GTTCGGCGTC 
GAGCTGGCCA TGCTCGACGA AGCGCGGGCT GTGGGGGCGG AGTTCAACCG CATCGCCGGG 
GAAAACTGCC TGTACTTTGA AACCGGGCAA GGGTCTGCGC TCTCCGCAGG CGCGAACTTT 
GGTGCCGACC AGGTGACGAT GGAAGCGCGT AACTACGGGC TGGCGCGCCA CTACGATCCG 
TTCCTGGTGA ACACCGTGGT GGGCTTTATC GGGCCGGAGT ATCTCTACAA CGACAGGCAG 
ATTATCCGCG CCGGTCTCGA AGATCACTTT ATGGGCAAGC TGAGCGGCAT CTCGATGGGC 
TGCGACTGCT GCTATACCAA CCATGCCGAC GCCGACCAGA ACCTTAACGA AAACCTGATG 
ATTCTGCTCG CCACTGCCGG CTGTAACTAC ATCATGGGGA TGCCGCTCGG CGACGACATC 
ATGCTCAACT ACCAGACCAC CGCTTTCCAC GATACCGCCA CCGTCCGTCA GTTGCTGAAT 
TTACGGCCAT CGCCGGAGTT TGAACGCTGG CTGGAAACGA TGGGCATTAT GGCAAACGGT 
CGTCTGACCA AACGGGCGGG CGATCCGTCA CTGTTCTTCT GA

Protein sequence

MKLKTTLFGN VYQFKDVKEV LAKANELRSG DVLAGVAAAS SQERVAAKQV LSEMTVADIR 
NNPVIAYEED CVTRLIQDDV NETAYNRIKN WSISELREYV LSDETSVDDI AFIRKGLTSE 
VVAAVAKICS NADLIYGGKK MPVIKKANTT IGIPGTFSCR LQPNDTRDDV QSIAAQIYEG 
LSFGAGDAVI GVNPVTDDVE NLTRVLDTVY GVIDKFNIPT QGCVLAHVTT QIEAIRRGAP 
GGLIFQSICG SEKGLKEFGV ELAMLDEARA VGAEFNRIAG ENCLYFETGQ GSALSAGANF 
GADQVTMEAR NYGLARHYDP FLVNTVVGFI GPEYLYNDRQ IIRAGLEDHF MGKLSGISMG 
CDCCYTNHAD ADQNLNENLM ILLATAGCNY IMGMPLGDDI MLNYQTTAFH DTATVRQLLN 
LRPSPEFERW LETMGIMANG RLTKRAGDPS LFF