Gene ECD_00268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00268
Symbol	betB
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	296889
End bp	298361
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	58%
IMG OID
Product	betaine aldehyde dehydrogenase, NAD-dependent
Protein accession	ACT42167
Protein GI	253976497
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.936072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCGAA TGGCAGAACA GCAGCTTTAT ATACATGGTG GTTATACCTC CGCCACCAGC 
GGTCGCACCT TCGAGACCAT TAACCCGGCC AACGGTAACG TGCTGGCGAC CGTGCAGGCC 
GCCGGGCGTG AGGATGTCGA TCGCGCCGTG AAGAGTGCCC AACAGGGGCA AAAAATCTGG 
GCGGCGATGA CCGCTATGGA ACGCTCGCGT ATTCTGCGTC GGGCCGTTGA TATTCTGCGT 
GAACGCAATG ACGAACTCGC AAAACTGGAA ACCCTCGACA CCGGAAAAGC ATATTCGGAA 
ACCTCAACCG TCGATATCGT TACCGGTGCG GACGTGCTGG AGTACTACGC CGGGCTGATC 
CCGGCGCTGG AAGGCAGCCA GATCCCGTTG CGTGAGACGT CATTTGTTTA TACCCGCCGC 
GAACCGCTGG GCGTGGTGGC GGGGATTGGC GCATGGAACT ACCCGATCCA GATTGCCCTG 
TGGAAATCCG CCCCGGCGCT GGCGGCAGGC AACGCAATGA TTTTCAAACC GAGCGAAGTC 
ACCCCGCTTA CCGCGTTAAA GCTGGCTGAA ATTTACAGCG AAGCGGGCCT GCCGGACGGC 
GTATTTAACG TGTTGCCGGG CGTGGGCGCG GAGACCGGGC AATATCTGAC CGAGCATCCG 
GGCATTGCCA AAGTGTCATT TACCGGCGGT GTCGCCAGCG GCAAAAAAGT GATGGCTAAC 
TCGGCGGCCT CTTCCCTGAA AGAAGTGACC ATGGAACTGG GCGGTAAATC GCCGCTGATC 
GTTTTCGACG ATGCGGATCT CGATCTCGCC GCCGATATCG CCATGATGGC AAACTTCTTC 
AGCTCCGGTC AGGTGTGTAC CAATGGCACC CGCGTCTTCG TTCCGGCGAA ATGCAAAGCC 
GCATTTGAGC AGAAAATTCT GGCGCGCGTT GAGCGCATTC GCGCGGGCGA CGTTTTCGAT 
CCGCAAACTA ACTTCGGCCC GCTGGTCAGC TTCCCGCATC GCGATAACGT GCTGCGCTAT 
ATCGTCAAAG GCAAAGAGGA AGGCGCGCGC GTACTGTGCG GCGGCGATGT ACTGAAAGGC 
GATGACTTCG ATAACGGCGC ATGGGTTGCA CCGACCGTGT TCACCGATTG CAGCGACGAT 
ATGACCATCG TGCGTGAAGA GATCTTCGGG CCAGTGATGT CCATTCTGAC CTACGAGTCG 
GAAGACGAAG TCATTCGCCG CGCTAACGAT ACCGACTACG GCCTGGCGGC GGGCATCGTG 
ACGGCGGACC TGAACCGCGC GCATCGCGTC ATTCATCAGC TGGAAGCGGG TATTTGCTGG 
ATCAACACCT GGGGCGAATC CCCGGCAGAG ATGCCCGTTG GCGGCTACAA ACACTCCGGC 
ATTGGTCGCG AGAACGGCGT GATGACGCTC CAGAGTTACA CCCAGGTGAA GTCCATCCAG 
GTTGAGATGG CTAAATTCCA GTCCATATTC TAA

Protein sequence

MSRMAEQQLY IHGGYTSATS GRTFETINPA NGNVLATVQA AGREDVDRAV KSAQQGQKIW 
AAMTAMERSR ILRRAVDILR ERNDELAKLE TLDTGKAYSE TSTVDIVTGA DVLEYYAGLI 
PALEGSQIPL RETSFVYTRR EPLGVVAGIG AWNYPIQIAL WKSAPALAAG NAMIFKPSEV 
TPLTALKLAE IYSEAGLPDG VFNVLPGVGA ETGQYLTEHP GIAKVSFTGG VASGKKVMAN 
SAASSLKEVT MELGGKSPLI VFDDADLDLA ADIAMMANFF SSGQVCTNGT RVFVPAKCKA 
AFEQKILARV ERIRAGDVFD PQTNFGPLVS FPHRDNVLRY IVKGKEEGAR VLCGGDVLKG 
DDFDNGAWVA PTVFTDCSDD MTIVREEIFG PVMSILTYES EDEVIRRAND TDYGLAAGIV 
TADLNRAHRV IHQLEAGICW INTWGESPAE MPVGGYKHSG IGRENGVMTL QSYTQVKSIQ 
VEMAKFQSIF