Gene EcDH1_4046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4046
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4384638
End bp	4385798
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	55%
IMG OID
Product	O-succinylhomoserine (thiol)-lyase
Protein accession	ACX41646
Protein GI	260451224
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCGTA AACAGGCCAC CATCGCAGTG CGTAGCGGGT TAAATGACGA CGAACAGTAT 
GGTTGCGTTG TCCCACCGAT CCATCTTTCC AGCACCTATA ACTTTACCGG ATTTAATGAA 
CCGCGCGCGC ATGATTACTC GCGTCGCGGC AACCCAACGC GCGATGTGGT TCAGCGTGCG 
CTGGCAGAAC TGGAAGGTGG TGCTGGTGCA GTACTTACTA ATACCGGCAT GTCCGCGATT 
CACCTGGTAA CGACCGTCTT TTTGAAACCT GGCGATCTGC TGGTTGCGCC GCACGACTGC 
TACGGCGGTA GCTATCGCCT GTTCGACAGT CTGGCGAAAC GCGGTTGCTA TCGCGTGTTG 
TTTGTTGATC AAGGCGATGA ACAGGCATTA CGGGCAGCGC TGGCAGAAAA ACCCAAACTG 
GTACTGGTAG AAAGCCCAAG TAATCCATTG TTACGCGTCG TGGATATTGC GAAAATCTGC 
CATCTGGCAA GGGAAGTCGG GGCGGTGAGC GTGGTGGATA ACACCTTCTT AAGCCCGGCA 
TTACAAAATC CGCTGGCATT AGGTGCCGAT CTGGTGTTGC ATTCATGCAC GAAATATCTG 
AACGGTCACT CAGACGTAGT GGCCGGCGTG GTGATTGCTA AAGACCCGGA CGTTGTCACT 
GAACTGGCCT GGTGGGCAAA CAATATTGGC GTGACGGGCG GCGCGTTTGA CAGCTATCTG 
CTGCTACGTG GGTTGCGAAC GCTGGTGCCG CGTATGGAGC TGGCGCAGCG CAACGCGCAG 
GCGATTGTGA AATACCTGCA AACCCAGCCG TTGGTGAAAA AACTGTATCA CCCGTCGTTG 
CCGGAAAATC AGGGGCATGA AATTGCCGCG CGCCAGCAAA AAGGCTTTGG CGCAATGTTG 
AGTTTTGAAC TGGATGGCGA TGAGCAGACG CTGCGTCGTT TCCTGGGCGG GCTGTCGTTG 
TTTACGCTGG CGGAATCATT AGGGGGAGTG GAAAGTTTAA TCTCTCACGC CGCAACCATG 
ACACATGCAG GCATGGCACC AGAAGCGCGT GCTGCCGCCG GGATCTCCGA GACGCTGCTG 
CGTATCTCCA CCGGTATTGA AGATGGCGAA GATTTAATTG CCGACCTGGA AAATGGCTTC 
CGGGCTGCAA ACAAGGGGTA A

Protein sequence

MTRKQATIAV RSGLNDDEQY GCVVPPIHLS STYNFTGFNE PRAHDYSRRG NPTRDVVQRA 
LAELEGGAGA VLTNTGMSAI HLVTTVFLKP GDLLVAPHDC YGGSYRLFDS LAKRGCYRVL 
FVDQGDEQAL RAALAEKPKL VLVESPSNPL LRVVDIAKIC HLAREVGAVS VVDNTFLSPA 
LQNPLALGAD LVLHSCTKYL NGHSDVVAGV VIAKDPDVVT ELAWWANNIG VTGGAFDSYL 
LLRGLRTLVP RMELAQRNAQ AIVKYLQTQP LVKKLYHPSL PENQGHEIAA RQQKGFGAML 
SFELDGDEQT LRRFLGGLSL FTLAESLGGV ESLISHAATM THAGMAPEAR AAAGISETLL 
RISTGIEDGE DLIADLENGF RAANKG