Gene EcDH1_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1784
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1935644
End bp	1936966
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	52%
IMG OID
Product	Peptidase M23
Protein accession	ACX39443
Protein GI	260449021
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000000000497391
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAACAGA TAGCCCGCTC TGTCGCCCTG GCGTTTAATA ATTTACCGCG ACCACACCGC 
GTTATGTTGG GGTCGCTCAC CGTTCTTACT CTGGCCGTCG CTGTCTGGCG GCCTTATGTT 
TATCACCGTG ATGCCACGCC AATTGTCAAA ACCATTGAGC TGGAACAGAA CGAAATTCGT 
TCGCTCTTAC CTGAAGCCAG TGAGCCGATT GATCAAGCTG CACAAGAAGA TGAAGCCATT 
CCCCAGGACG AACTGGATGA CAAAATCGCC GGTGAAGCGG GCGTGCATGA ATATGTTGTT 
TCCACTGGCG ATACGCTAAG CAGCATTCTC AATCAGTATG GTATTGATAT GGGTGATATC 
ACCCAACTGG CTGCGGCCGA CAAAGAATTG CGTAACCTGA AAATCGGTCA ACAACTCTCC 
TGGACATTAA CCGCGGACGG CGAACTGCAG CGCCTCACCT GGGAAGTGTC TCGTCGTGAA 
ACCCGAACCT ATGACCGTAC TGCCGCTAAC GGTTTTAAAA TGACCAGCGA AATGCAGCAA 
GGAGAGTGGG TTAACAATCT GCTGAAAGGT ACCGTCGGGG GAAGCTTTGT TGCCAGCGCC 
AGAAACGCCG GTTTAACCAG CGCCGAAGTG AGCGCAGTGA TTAAAGCCAT GCAGTGGCAA 
ATGGATTTCC GCAAACTGAA AAAAGGCGAT GAATTTGCGG TGTTAATGTC TCGAGAAATG 
CTTGATGGTA AACGTGAGCA AAGCCAGCTG CTGGGCGTAC GTTTGCGTTC AGAAGGTAAA 
GATTATTACG CTATCCGCGC TGAAGATGGC AAATTCTACG ATCGTAACGG TACTGGTCTG 
GCGAAAGGAT TCTTGCGATT CCCGACGGCG AAACAGTTCC GTATCTCGTC TAATTTTAAC 
CCGCGTCGTA CTAATCCGGT GACCGGTCGC GTTGCACCAC ACAGAGGTGT TGATTTCGCC 
ATGCCGCAGG GTACGCCAGT GCTTTCAGTG GGTGACGGTG AAGTGGTGGT TGCCAAACGC 
AGTGGCGCAG CAGGTTATTA TGTGGCTATT CGTCATGGTC GCAGCTACAC CACGCGTTAT 
ATGCACTTGC GCAAGATTCT GGTGAAACCG GGACAGAAGG TGAAACGTGG CGACCGTATC 
GCGCTTTCCG GTAATACCGG ACGTTCAACC GGGCCGCATC TGCACTATGA AGTATGGATA 
AACCAGCAGG CCGTAAACCC GCTGACGGCA AAACTGCCGC GTACCGAAGG GCTGACCGGC 
TCCGATCGTC GCGAATTCCT GGCGCAGGCC AAAGAGATTG TGCCGCAGCT ACGGTTTGAT 
TAA

Protein sequence

MQQIARSVAL AFNNLPRPHR VMLGSLTVLT LAVAVWRPYV YHRDATPIVK TIELEQNEIR 
SLLPEASEPI DQAAQEDEAI PQDELDDKIA GEAGVHEYVV STGDTLSSIL NQYGIDMGDI 
TQLAAADKEL RNLKIGQQLS WTLTADGELQ RLTWEVSRRE TRTYDRTAAN GFKMTSEMQQ 
GEWVNNLLKG TVGGSFVASA RNAGLTSAEV SAVIKAMQWQ MDFRKLKKGD EFAVLMSREM 
LDGKREQSQL LGVRLRSEGK DYYAIRAEDG KFYDRNGTGL AKGFLRFPTA KQFRISSNFN 
PRRTNPVTGR VAPHRGVDFA MPQGTPVLSV GDGEVVVAKR SGAAGYYVAI RHGRSYTTRY 
MHLRKILVKP GQKVKRGDRI ALSGNTGRST GPHLHYEVWI NQQAVNPLTA KLPRTEGLTG 
SDRREFLAQA KEIVPQLRFD