Gene EcolC_0837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0837
Symbol
ID	6065236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	904037
End bp	905233
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	53%
IMG OID	641600242
Product	diaminopropionate ammonia-lyase
Protein accession	YP_001723836
Protein GI	170018882
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family [TIGR03528] diaminopropionate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTTT TCTCATTGAA GATTGATATC GCCGATAACA AATTTTTCAA CGGCGAAACA 
TCACCGCTCT TTTCGCAAAG CCAAGCCAAA CTGGCGCGCC AGTTCCACCA GAAAATAGCT 
GGTTATCGCC CAACACCGCT TTGTGCGCTG GACGATCTCG CAAACCTTTT TGGTGTGAAG 
AAAATTCTCG TCAAAGACGA ATCAAAACGA TTCGGTCTGA ACGCCTTCAA AATGCTTGGC 
GGTGCGTACG CCATCGCTCA ATTATTGTGT GAAAAATATC ATCTTGATAT CGAAACGCTG 
TCATTTGAGC ACCTGAAAAA TACCATCGGC GAAAAAATGA CTTTCGCGAC CACCACCGAC 
GGCAACCACG GGCGCGGTGT GGCGTGGGCA GCACAGCAAC TCGGACAGAA TGCGGTGATT 
TACATGCCGA AAGGTTCTGC TCAGGAACGC GTTGACGCCA TTCTGAACCT CGGTGCCGAG 
TGCATCGTCA CAGATATGAA CTATGACGAT ACCGTTCGCC TGACCATGCA ACACGCGCAG 
CAGCACGGCT GGGAAGTGGT ACAGGACACG GCATGGGAAG GTTACACCAA AATCCCAACC 
TGGATCATGC AAGGCTACGC AACCCTGGCA GATGAAGCCG TCGAGCAAAT GCGTGAAATG 
GGCGTAACCC CGACGCACGT TCTGCTGCAA GCCGGTGTCG GAGCAATGGC CGGTGGTGTG 
CTGGGTTATC TGGTCGACGT CTACAGCCCG CAAAATCTGC ACAGCATTAT TGTTGAACCT 
GACAAAGCTG ACTGTATTTA TCGCTCCGGC GTCAAAGGCG ACATCGTCAA CGTTGGCGGT 
GATATGGCCA CCATCATGGC GGGCCTGGCC TGTGGCGAAC CTAACCCGCT GGGCTGGGAA 
ATCCTACGTA ACTGCGCCAC CCAATTCATC TCCTGCCAGG ACAGCGTTGC CGCATTAGGT 
ATGCGCGTGC TGGGTAATCC GTACGGCAAC GACCCGCGCA TCATCTCCGG TGAATCCGGC 
GCTGTCGGTT TGGGCGTTCT CGCAGCGGTT CATTATCACC CGCAACGTCA AAGCCTGATG 
GAAAAACTGG CGCTGAACAA AGATGCCGTA GTGCTGGTTA TCAGTACTGA AGGCGACACC 
GACGTGAAGC ACTACCGCGA AGTTGTCTGG GAAGGCAAAC ACGCTGTAGC ACCTTAA

Protein sequence

MSVFSLKIDI ADNKFFNGET SPLFSQSQAK LARQFHQKIA GYRPTPLCAL DDLANLFGVK 
KILVKDESKR FGLNAFKMLG GAYAIAQLLC EKYHLDIETL SFEHLKNTIG EKMTFATTTD 
GNHGRGVAWA AQQLGQNAVI YMPKGSAQER VDAILNLGAE CIVTDMNYDD TVRLTMQHAQ 
QHGWEVVQDT AWEGYTKIPT WIMQGYATLA DEAVEQMREM GVTPTHVLLQ AGVGAMAGGV 
LGYLVDVYSP QNLHSIIVEP DKADCIYRSG VKGDIVNVGG DMATIMAGLA CGEPNPLGWE 
ILRNCATQFI SCQDSVAALG MRVLGNPYGN DPRIISGESG AVGLGVLAAV HYHPQRQSLM 
EKLALNKDAV VLVISTEGDT DVKHYREVVW EGKHAVAP