Gene EcDH1_0946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0946
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1015010
End bp	1016149
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	52%
IMG OID
Product	Peptidase M23
Protein accession	ACX38629
Protein GI	260448207
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0564272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGG GAAGCCCAAA ATTCACCGTT CGCCGCATTG CGGCTTTGTC ACTGGTTTCG 
CTATGGCTGG CAGGCTGTTC TGACACTTCA AATCCACCGG CACCGGTCAG CTCCGTTAAT 
GGCAATGCGC CTGCAAATAC TAATTCTGGT ATGTTGATTA CGCCGCCGCC GAAAATGGGG 
ACGACGTCTA CAGCGCAGCA ACCGCAAATT CAGCCGGTGC AGCAGCCACA AATTCAGGCT 
ACTCAACAAC CGCAAATCCA GCCAGTGCAG CCAGTAGCTC AGCAGCCGGT ACAGATGGAA 
AACGGACGCA TCGTCTATAA CCGTCAGTAT GGGAACATTC CGAAAGGCAG TTATAGCGGC 
AGTACCTATA CCGTGAAAAA AGGCGACACA CTTTTCTATA TCGCCTGGAT TACTGGCAAC 
GATTTCCGTG ACCTTGCTCA GCGCAACAAT ATTCAGGCAC CATACGCGCT GAACGTTGGT 
CAGACCTTGC AGGTGGGTAA TGCTTCCGGT ACGCCAATCA CTGGCGGAAA TGCCATTACC 
CAGGCCGACG CAGCAGAGCA AGGAGTTGTG ATCAAGCCTG CACAAAATTC CACCGTTGCT 
GTTGCGTCGC AACCGACAAT TACGTATTCT GAGTCTTCGG GTGAACAGAG TGCTAACAAA 
ATGTTGCCGA ACAACAAGCC AACTGCGACC ACGGTCACAG CGCCTGTAAC GGTACCAACA 
GCAAGCACAA CCGAGCCGAC TGTCAGCAGT ACATCAACCA GTACGCCTAT CTCCACCTGG 
CGCTGGCCGA CTGAGGGCAA AGTGATCGAA ACCTTTGGCG CTTCTGAGGG GGGCAACAAG 
GGGATTGATA TCGCAGGCAG CAAAGGACAG GCAATTATCG CGACCGCAGA TGGCCGCGTT 
GTTTATGCTG GTAACGCGCT GCGCGGCTAC GGTAATCTGA TTATCATCAA ACATAATGAT 
GATTACCTGA GTGCCTACGC CCATAACGAC ACAATGCTGG TCCGGGAACA ACAAGAAGTT 
AAGGCGGGGC AAAAAATAGC GACCATGGGT AGCACCGGAA CCAGTTCAAC ACGCTTGCAT 
TTTGAAATTC GTTACAAGGG GAAATCCGTA AACCCGCTGC GTTATTTGCC GCAGCGATAA

Protein sequence

MSAGSPKFTV RRIAALSLVS LWLAGCSDTS NPPAPVSSVN GNAPANTNSG MLITPPPKMG 
TTSTAQQPQI QPVQQPQIQA TQQPQIQPVQ PVAQQPVQME NGRIVYNRQY GNIPKGSYSG 
STYTVKKGDT LFYIAWITGN DFRDLAQRNN IQAPYALNVG QTLQVGNASG TPITGGNAIT 
QADAAEQGVV IKPAQNSTVA VASQPTITYS ESSGEQSANK MLPNNKPTAT TVTAPVTVPT 
ASTTEPTVSS TSTSTPISTW RWPTEGKVIE TFGASEGGNK GIDIAGSKGQ AIIATADGRV 
VYAGNALRGY GNLIIIKHND DYLSAYAHND TMLVREQQEV KAGQKIATMG STGTSSTRLH 
FEIRYKGKSV NPLRYLPQR