Gene ECH74115_0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0043
Symbol	caiA
ID	6968409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	43651
End bp	44793
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	54%
IMG OID	643384124
Product	crotonobetainyl-CoA dehydrogenase
Protein accession	YP_002268647
Protein GI	209399530
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTTA ATTTAAATGA TGAGCAGGAA CTGTTTGTCG CCGGTATCCG CGAACTGATG 
GCCAGCGAAA ACTGGGAGGC CTATTTTGCC GAGTGCGACC GTGACAGCGT CTACCCGGAA 
CGTTTTGTCA AAGCACTGGC GGATATGGGT ATCGACAGTC TGCTGATCCC TGAAGAGCAC 
GGTGGTCTGG ACGCGGGGTT TGTTACTCTC GCCGCCGTGT GGATGGAGCT GGGACGTCTG 
GGGGCACCAA CCTATGTACT GTACCAGTTG CCGGGCGGGT TCAATACCTT CCTGCGCGAA 
GGCACACAAG AGCAGATCGA CAAGATTATG GCTTTCCGCG GCACCGGTAA GCAGATGTGG 
AACTCAGCGA TTACCGAACC GGGCGCGGGC TCCGACGTGG GTAGCCTGAA AACGACTTAT 
ACCCGTAGAA ATGGTAAGAT TTATCTTAAT GGTAGTAAGT GTTTTATTAC CAGTAGCGCC 
TACACCCCGT ACATCGTGGT GATGGCGCGC GACGGGGCTT CTCCGGACAA ACCTGTCTAC 
ACCGAATGGT TTGTTGATAT GAGCAAACCG GGCATCAAAG TGACCAAACT TGAGAAGCTC 
GGTCTGCGTA TGGATAGCTG CTGTGAAATC ACCTTTGACG ATGTGGAACT GGACGAGAAA 
GACATGTTCG GTCGGGAAGG TAACGGCTTT AACCGCGTCA AAGAAGAGTT CGACCATGAA 
CGTTTCCTGG TAGCCCTGAC CAACTACGGT ACGGCGATGT GCGCCTTTGA AGATGCGGCG 
CGCTACGCCA ACCAGCGCGT GCAGTTTGGC GAGGCTATTG GTCGTTTCCA GTTGATTCAG 
GAAAAATTCG CCCACATGGC GATCAAATTA AACTCCATGA AAAACATGCT GTATGAAGCA 
GCGTGGAAAG CAGACAACGG CACCATCACC TCTGGCGATG CAGCGATGTG CAAATACTTC 
TGCGCCAATG CGGCATTTGA AGTGGTGGAT AGCGCAATGC AGGTGCTGGG CGGTGTCGGG 
ATTGCGGGCA ACCACCGCAT CAGCCGCTTC TGGCGTGACC TGCGTGTAGA CCGCGTTTCC 
GGAGGATCTG ACGAAATGCA GATCCTGACG CTGGGTCGTG CGGTGCTGAA GCAATACCGC 
TAA

Protein sequence

MDFNLNDEQE LFVAGIRELM ASENWEAYFA ECDRDSVYPE RFVKALADMG IDSLLIPEEH 
GGLDAGFVTL AAVWMELGRL GAPTYVLYQL PGGFNTFLRE GTQEQIDKIM AFRGTGKQMW 
NSAITEPGAG SDVGSLKTTY TRRNGKIYLN GSKCFITSSA YTPYIVVMAR DGASPDKPVY 
TEWFVDMSKP GIKVTKLEKL GLRMDSCCEI TFDDVELDEK DMFGREGNGF NRVKEEFDHE 
RFLVALTNYG TAMCAFEDAA RYANQRVQFG EAIGRFQLIQ EKFAHMAIKL NSMKNMLYEA 
AWKADNGTIT SGDAAMCKYF CANAAFEVVD SAMQVLGGVG IAGNHRISRF WRDLRVDRVS 
GGSDEMQILT LGRAVLKQYR