Gene EcHS_A3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3031
Symbol
ID	5594627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3035024
End bp	3036220
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	53%
IMG OID	640922148
Product	diaminopropionate ammonia-lyase
Protein accession	YP_001459650
Protein GI	157162332
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family [TIGR03528] diaminopropionate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGTTT TCTCATTGAA GATTGATATC GCCGATAACA AATTTTTCAA CGGCGAAACA 
TCACCGCTCT TTTCGCAAAG CCAAGCCAAA CTGGCGCGCC AGTTCCACCA GAAAATAGCT 
GGTTATCGCC CAACACCGCT TTGTGCGCTG GACGATCTCG CAAACCTTTT TGGTGTGAAG 
AAAATTCTCG TCAAAGACGA ATCAAAACGA TTCGGTCTGA ACGCCTTCAA AATGCTTGGC 
GGTGCGTACG CCATCGCTCA ATTATTGTGT GAAAAATATC ATCTTGATAT CGAAACGCTG 
TCATTTGAGC ACCTGAAAAA TACCATCGGC GAAAAAATGA CTTTCGCGAC CACCACCGAC 
GGCAACCACG GGCGCGGTGT GGCGTGGGCA GCACAGCAAC TCGGACAGAA TGCGGTGATT 
TACATGCCGA AAGGTTCTGC TCAGGAACGC GTTGACGCCA TTCTGAACCT CGGTGCCGAG 
TGCATCGTCA CAGATATGAA CTATGACGAT ACCGTTCGCC TGACCATGCA ACACGCGCAG 
CAGCACGGCT GGGAAGTGGT ACAGGACACG GCATGGGAAG GTTACACCAA AATCCCAACC 
TGGATCATGC AAGGCTACGC AACCCTGGCA GATGAAGCCG TCGAGCAAAT GCGTGAAATG 
GGCGTAACCC CGACGCACGT TCTGCTGCAA GCCGGTGTCG GAGCAATGGC CGGTGGTGTG 
CTGGGTTATC TGGTCGACGT CTACAGCCCG CAAAATCTGC ACAGCATTAT TGTTGAACCT 
GACAAAGCTG ACTGTATTTA TCGCTCCGGC GTCAAAGGCG ACATCGTCAA CGTTGGCGGT 
GATATGGCCA CCATCATGGC GGGCCTGGCC TGTGGCGAAC CTAACCCGCT GGGCTGGGAA 
ATCCTACGTA ACTGCGCCAC CCAATTCATC TCCTGCCAGG ACAGCGTTGC CGCATTAGGT 
ATGCGCGTGC TGGGTAATCC GTACGGCAAC GACCCGCGCA TCATCTCCGG TGAATCCGGC 
GCTGTCGGTT TGGGCGTTCT CGCAGCGGTT CATTATCACC CGCAACGTCA AAGCCTGATG 
GAAAAACTGG CGCTGAACAA AGATGCCGTA GTGCTGGTTA TCAGTACTGA AGGCGACACC 
GACGTGAAGC ACTACCGCGA AGTTGTCTGG GAAGGCAAAC ACGCTGTAGC ACCTTAA

Protein sequence

MSVFSLKIDI ADNKFFNGET SPLFSQSQAK LARQFHQKIA GYRPTPLCAL DDLANLFGVK 
KILVKDESKR FGLNAFKMLG GAYAIAQLLC EKYHLDIETL SFEHLKNTIG EKMTFATTTD 
GNHGRGVAWA AQQLGQNAVI YMPKGSAQER VDAILNLGAE CIVTDMNYDD TVRLTMQHAQ 
QHGWEVVQDT AWEGYTKIPT WIMQGYATLA DEAVEQMREM GVTPTHVLLQ AGVGAMAGGV 
LGYLVDVYSP QNLHSIIVEP DKADCIYRSG VKGDIVNVGG DMATIMAGLA CGEPNPLGWE 
ILRNCATQFI SCQDSVAALG MRVLGNPYGN DPRIISGESG AVGLGVLAAV HYHPQRQSLM 
EKLALNKDAV VLVISTEGDT DVKHYREVVW EGKHAVAP