Gene ECD_00043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00043
Symbol	caiA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	43438
End bp	44580
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	54%
IMG OID
Product	crotonobetaine reductase subunit II, FAD-binding
Protein accession	ACT41944
Protein GI	253976274
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTTA ATTTAAATGA TGAGCAGGAA CTGTTTGTCG CCGGTATCCG CGAACTGATG 
GCCAGCGAAA ACTGGGAGGC CTATTTTGCC GAGTGCGACC GTGACAGCGT CTACCCGGAA 
CGTTTTGTCA AAGCACTGGC GGATATGGGT ATCGACAGTC TGCTGATCCC TGAAGAGCAC 
GGTGGTCTGG ACGCGGGGTT TGTTACTCTC GCCGCCGTGT GGATGGAGCT GGGACGTCTG 
GGGGCACCAA CCTATGTGCT GTACCAGTTG CCGGGCGGGT TCAACACCTT CCTGCGCGAA 
GGCACACAAG AGCAGATCGA CAAAATTATG GCTTTCCGCG GCACCGGTAA GCAGATGTGG 
AACTCAGCGA TTACCGAACC GGGCGCGGGC TCCGACGTGG GTAGCCTGAA AACGACTTAT 
ACCCGTAGAA ATGGTAAGAT TTATCTTAAT GGTAGTAAGT GTTTTATTAC CAGCAGCGCC 
TACACCCCGT ACATCGTGGT GATGGCGCGC GACGGGGCTT CTCCGGACAA ACCTGTCTAC 
ACCGAATGGT TTGTTGATAT GAGCAAACCG GGCATCAAAG TGACCAAACT TGAGAAGCTC 
GGTCTGCGTA TGGATAGCTG CTGTGAAATC ACCTTTGACG ACGTGGAACT GGACGAGAAA 
GACATGTTCG GTCGGGAAGG TAACGGCTTT AACCGCGTCA AAGAAGAGTT CGACCATGAA 
CGTTTCCTGG TAGCCCTCAC CAACTACGGT ACGGCGATGT GCGCCTTTGA AGATGCGGCG 
CGCTACGCCA ATCAGCGCGT GCAGTTTGGC GAGGCTATTG GTCGTTTCCA GTTGATTCAG 
GAAAAATTCG CCCACATGGC GATCAAATTA AACTCCATGA AAAACATGCT GTATGAAGCA 
GCGTGGAAAG CAGACAACGG CACCATCACC TCTGGCGATG CAGCGATGTG CAAATACTTC 
TGCGCCAATG CGGCATTTGA AGTGGTGGAT AGCGCAATGC AGGTGCTGGG CGGTGTCGGG 
ATTGCGGGCA ACCACCGCAT CAGCCGCTTC TGGCGTGACC TGCGTGTAGA CCGCGTTTCC 
GGAGGATCTG ACGAAATGCA GATCCTGACG CTGGGTCGTG CGGTGCTGAA GCAATACCGC 
TAA

Protein sequence

MDFNLNDEQE LFVAGIRELM ASENWEAYFA ECDRDSVYPE RFVKALADMG IDSLLIPEEH 
GGLDAGFVTL AAVWMELGRL GAPTYVLYQL PGGFNTFLRE GTQEQIDKIM AFRGTGKQMW 
NSAITEPGAG SDVGSLKTTY TRRNGKIYLN GSKCFITSSA YTPYIVVMAR DGASPDKPVY 
TEWFVDMSKP GIKVTKLEKL GLRMDSCCEI TFDDVELDEK DMFGREGNGF NRVKEEFDHE 
RFLVALTNYG TAMCAFEDAA RYANQRVQFG EAIGRFQLIQ EKFAHMAIKL NSMKNMLYEA 
AWKADNGTIT SGDAAMCKYF CANAAFEVVD SAMQVLGGVG IAGNHRISRF WRDLRVDRVS 
GGSDEMQILT LGRAVLKQYR