Gene EcDH1_3294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3294
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3542222
End bp	3543694
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	58%
IMG OID
Product	betaine aldehyde dehydrogenase
Protein accession	ACX40918
Protein GI	260450496
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCGAA TGGCAGAACA GCAGCTTTAT ATACATGGTG GTTATACCTC CGCCACCAGC 
GGTCGCACCT TCGAGACCAT TAACCCGGCC AACGGTAACG TGCTGGCGAC CGTGCAGGCC 
GCCGGGCGCG AGGATGTCGA TCGCGCCGTG AAAAGCGCCC AGCAGGGGCA AAAAATCTGG 
GCGTCGATGA CCGCCATGGA GCGCTCGCGT ATTCTGCGTC GGGCCGTTGA TATTCTGCGT 
GAACGCAATG ACGAACTCGC AAAACTGGAA ACCCTCGACA CCGGAAAAGC ATATTCGGAA 
ACCTCAACCG TCGATATCGT TACCGGTGCG GACGTGCTGG AGTACTACGC CGGGCTGATC 
CCGGCGCTGG AAGGCAGCCA GATCCCGTTG CGTGAAACGT CCTTTGTGTA TACCCGCCGC 
GAACCGCTGG GCGTAGTGGC AGGGATTGGC GCATGGAACT ACCCGATCCA GATTGCCCTG 
TGGAAATCCG CCCCGGCGCT GGCGGCAGGC AACGCAATGA TTTTCAAACC GAGCGAAGTT 
ACCCCGCTTA CCGCGTTAAA GCTGGCTGAA ATTTACAGCG AAGCGGGCCT GCCGGACGGC 
GTATTTAACG TGTTGCCGGG CGTGGGCGCG GAGACCGGGC AATATCTGAC CGAGCATCCG 
GGCATTGCCA AAGTGTCATT TACCGGCGGT GTCGCCAGCG GCAAAAAAGT GATGGCTAAC 
TCGGCGGCCT CTTCTCTGAA AGAAGTGACC ATGGAACTGG GCGGTAAATC ACCGCTGATC 
GTTTTCGATG ATGCGGATCT CGATCTCGCC GCCGATATCG CCATGATGGC AAACTTCTTC 
AGCTCCGGTC AGGTGTGTAC CAATGGCACC CGCGTCTTCG TTCCGGCGAA ATGCAAAGCC 
GCATTTGAGC AGAAAATTCT GGCGCGCGTT GAGCGCATTC GCGCGGGCGA CGTTTTCGAT 
CCGCAAACTA ACTTCGGCCC GCTGGTCAGC TTCCCGCATC GCGATAACGT GCTGCGCTAT 
ATCGCCAAAG GCAAAGAGGA AGGCGCGCGC GTACTGTGCG GCGGCGATGT ACTGAAAGGC 
GATGGCTTCG ATAACGGCGC ATGGGTTGCA CCGACAGTGT TCACCGATTG CAGCGACGAT 
ATGACCATCG TGCGTGAAGA GATCTTCGGG CCAGTGATGT CCATTCTGAC CTACGAGTCG 
GAAGACGAAG TCATTCGCCG CGCTAACGAT ACCGACTACG GCCTGGCGGC GGGCATCGTG 
ACAGCGGACC TGAACCGCGC GCATCGCGTC ATTCATCAGC TGGAAGCGGG TATTTGCTGG 
ATCAACACCT GGGGCGAATC CCCGGCAGAG ATGCCCGTTG GCGGCTACAA ACACTCCGGC 
ATTGGTCGCG AGAACGGCGT GATGACGCTC CAGAGTTACA CCCAGGTGAA GTCCATCCAG 
GTTGAGATGG CTAAATTCCA GTCCATATTC TAA

Protein sequence

MSRMAEQQLY IHGGYTSATS GRTFETINPA NGNVLATVQA AGREDVDRAV KSAQQGQKIW 
ASMTAMERSR ILRRAVDILR ERNDELAKLE TLDTGKAYSE TSTVDIVTGA DVLEYYAGLI 
PALEGSQIPL RETSFVYTRR EPLGVVAGIG AWNYPIQIAL WKSAPALAAG NAMIFKPSEV 
TPLTALKLAE IYSEAGLPDG VFNVLPGVGA ETGQYLTEHP GIAKVSFTGG VASGKKVMAN 
SAASSLKEVT MELGGKSPLI VFDDADLDLA ADIAMMANFF SSGQVCTNGT RVFVPAKCKA 
AFEQKILARV ERIRAGDVFD PQTNFGPLVS FPHRDNVLRY IAKGKEEGAR VLCGGDVLKG 
DGFDNGAWVA PTVFTDCSDD MTIVREEIFG PVMSILTYES EDEVIRRAND TDYGLAAGIV 
TADLNRAHRV IHQLEAGICW INTWGESPAE MPVGGYKHSG IGRENGVMTL QSYTQVKSIQ 
VEMAKFQSIF