Gene EcSMS35_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0040
Symbol	caiA
ID	6146162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	44423
End bp	45565
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	54%
IMG OID	641614941
Product	crotonobetainyl-CoA dehydrogenase
Protein accession	YP_001742157
Protein GI	170680462
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTTA ATTTAAATGA TGAGCAGGAA CTGTTTGTCG CCGGTATCCG CGAACTGATG 
GCCAGCGAAA ACTGGGAGGC CTATTTTGCC GAGTGCGACC GTGACAGCGT CTACCCGGAA 
CGTTTTGTCA AAGCACTGGC GGATATGGGT ATCGACAGTC TGCTGATCCC TGAAGAGCAC 
GGTGGTCTGG ACGCGGGGTT TGTTACTCTC GCCGCCGTGT GGATGGAGCT GGGACGTCTG 
GGGGCACCAA CCTATGTGCT GTACCAGTTG CCGGGCGGGT TCAATACCTT CCTGCGCGAA 
GGCACACAAG AGCAGATCGA CAAGATTATG GCTTTCCGCG GCACCGGTAA GCAGATGTGG 
AACTCAGCGA TTACCGAACC GGGTGCGGGC TCCGACGTGG GTAGCCTGAA AACGACTTAT 
ACCCGTAGAA ATGGTAAGAT TTATCTTAAT GGTAGTAAGT GTTTTATTAC CAGTAGCGCC 
TACACCCCGT ACATCGTGGT GATGGCGCGC GACGGGGCTT CTCCGGACAA ACCTGTCTAC 
ACCGAATGGT TTGTTGATAT GAGCAAACCG GGCATCAAAG TGACCAAACT TGAAAAGCTC 
GGTCTGCGTA TGGATAGCTG CTGTGAAATC ACTTTTGACG ACGTGGAACT GGACGAGAAA 
GACATGTTCG GTCGGGAAGG TAACGGCTTT AACCGCGTCA AAGAAGAGTT CGACCATGAA 
CGTTTCCTGG TAGCCCTGAC CAACTACGGT ACGGCGATGT GCGCCTTTGA AGATGCGGCG 
CGCTACGCCA ACCAGCGTGT GCAGTTTGGC GAGGCTATTG GTCGTTTCCA GTTGATTCAG 
GAAAAATTCG CCCACATGGC GATCAAATTA AACTCCATGA AAAACATGCT GTATGAAGCA 
GCGTGGAAAG CAGACAACGG CACCATCACC TCTGGCGATG CAGCGATGTG CAAATACTTC 
TGCGCCAATG CGGCATTTGA AGTGGTGGAT AGCGCAATGC AGGTGCTGGG CGGTGTCGGG 
ATTGCGGGCA ACCACCGCAT CAGCCGCTTC TGGCGTGACC TGCGTGTAGA CCGCGTTTCC 
GGAGGATCTG ACGAAATGCA GATCCTGACG CTGGGTCGCG CGGTGCTGAA GCAATACCGC 
TAA

Protein sequence

MDFNLNDEQE LFVAGIRELM ASENWEAYFA ECDRDSVYPE RFVKALADMG IDSLLIPEEH 
GGLDAGFVTL AAVWMELGRL GAPTYVLYQL PGGFNTFLRE GTQEQIDKIM AFRGTGKQMW 
NSAITEPGAG SDVGSLKTTY TRRNGKIYLN GSKCFITSSA YTPYIVVMAR DGASPDKPVY 
TEWFVDMSKP GIKVTKLEKL GLRMDSCCEI TFDDVELDEK DMFGREGNGF NRVKEEFDHE 
RFLVALTNYG TAMCAFEDAA RYANQRVQFG EAIGRFQLIQ EKFAHMAIKL NSMKNMLYEA 
AWKADNGTIT SGDAAMCKYF CANAAFEVVD SAMQVLGGVG IAGNHRISRF WRDLRVDRVS 
GGSDEMQILT LGRAVLKQYR