Gene EcDH1_0821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0821
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	875057
End bp	876253
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	54%
IMG OID
Product	diaminopropionate ammonia-lyase
Protein accession	ACX38505
Protein GI	260448083
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGTTT TCTCATTGAA GATTGATATC GCCGATAACA AATTTTTCAA CGGCGAAACA 
TCACCGCTCT TTTCGCAAAG CCAGGCCAAA CTGGCGCGCC AGTTCCACCA GAAAATAGCT 
GGTTATCGCC CAACACCGCT TTGTGCGCTG GACGATCTCG CAAACCTTTT TGGTGTGAAG 
AAAATTCTCG TCAAAGACGA ATCAAAACGA TTCGGTCTGA ACGCCTTCAA AATGCTTGGC 
GGTGCGTACG CCATCGCTCA ATTATTGTGT GAAAAATATC ATCTTGATAT CGAAACGCTG 
TCATTTGAGC ACCTGAAAAA TGCCATCGGC GAAAAAATGA CTTTCGCGAC CACCACCGAC 
GGCAACCACG GGCGCGGTGT GGCGTGGGCA GCACAGCAAC TCGGACAGAA TGCGGTGATT 
TACATGCCGA AAGGTTCTGC TCAGGAACGC GTTGACGCCA TTCTGAACCT CGGTGCCGAG 
TGCATCGTCA CGGATATGAA CTATGACGAT ACCGTTCGCC TGACCATGCA ACACGCGCAG 
CAGCACGGCT GGGAAGTGGT ACAGGACACG GCATGGGAAG GTTACACCAA AATCCCAACC 
TGGATCATGC AAGGCTACGC AACCCTGGCA GATGAAGCCG TCGAGCAAAT GCGTGAAATG 
GGCGTAACCC CGACGCACGT TCTGCTGCAA GCCGGTGTCG GAGCAATGGC CGGTGGTGTG 
CTGGGTTATC TGGTCGACGT CTATAGCCCG CAAAATCTGC ACAGCATTAT TGTTGAACCT 
GACAAAGCTG ACTGTATTTA TCGCTCCGGC GTCAAAGGCG ACATCGTCAA CGTTGGCGGT 
GATATGGCCA CCATCATGGC AGGCCTGGCC TGTGGCGAAC CTAACCCGCT GGGCTGGGAA 
ATCCTACGTA ACTGCGCCAC CCAATTCATC TCCTGCCAGG ACAGCGTTGC CGCATTAGGT 
ATGCGCGTGC TGGGTAATCC GTACGGCAAC GACCCGCGCA TCATCTCCGG TGAATCCGGC 
GCTGTCGGTT TGGGCGTTCT CGCAGCGGTT CATTATCACC CGCAACGTCA AAGCCTGATG 
GAAAAACTGG CGCTGAACAA AGATGCCGTG GTGCTGGTTA TCAGCACTGA AGGCGACACC 
GACGTGAAGC ACTACCGCGA AGTTGTCTGG GAAGGCAAAC ACGCTGTAGC ACCTTAA

Protein sequence

MSVFSLKIDI ADNKFFNGET SPLFSQSQAK LARQFHQKIA GYRPTPLCAL DDLANLFGVK 
KILVKDESKR FGLNAFKMLG GAYAIAQLLC EKYHLDIETL SFEHLKNAIG EKMTFATTTD 
GNHGRGVAWA AQQLGQNAVI YMPKGSAQER VDAILNLGAE CIVTDMNYDD TVRLTMQHAQ 
QHGWEVVQDT AWEGYTKIPT WIMQGYATLA DEAVEQMREM GVTPTHVLLQ AGVGAMAGGV 
LGYLVDVYSP QNLHSIIVEP DKADCIYRSG VKGDIVNVGG DMATIMAGLA CGEPNPLGWE 
ILRNCATQFI SCQDSVAALG MRVLGNPYGN DPRIISGESG AVGLGVLAAV HYHPQRQSLM 
EKLALNKDAV VLVISTEGDT DVKHYREVVW EGKHAVAP