Gene EcDH1_1797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1797
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1948440
End bp	1950500
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	50%
IMG OID
Product	Oligopeptidase B
Protein accession	ACX39456
Protein GI	260449034
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTACCAA AAGCCGCCCG CATTCCCCAC GCCATGACGC TTCATGGCGA TACGCGCATC 
GATAATTACT ACTGGCTGCG GGACGATACG CGTTCTCAGC CAGAAGTCCT GGACTACCTG 
CAACAAGAAA ATAGTTACGG TCATCGGGTG ATGGCCTCAC AACAAGCCTT GCAGGATCGC 
ATCTTAAAGG AAATCATCGA CCGCATTCCG CAACGAGAAG TTTCTGCGCC CTACATCAAA 
AATGGCTACC GCTATCGGCA TATTTATGAA CCAGGCTGTG AATATGCTAT CTACCAGCGT 
CAATCGGCAT TCAGTGAAGA GTGGGATGAG TGGGAAACAT TGCTCGATGC CAATAAGCGC 
GCAGCTCATA GTGAGTTTTA TTCGATGGGC GGAATGGCGA TTACGCCCGA TAACACCATT 
ATGGCGCTGG CAGAAGATTT TCTTTCCCGA CGCCAGTACG GCATTCGTTT TCGTAATCTG 
GAAACTGGTA ACTGGTACCC GGAACTGCTG GATAACGTTG AACCCAGCTT TGTCTGGGCA 
AATGACTCCT GGATTTTCTA CTATGTTCGC AAGCATCCGG TGACGCTGCT GCCTTATCAG 
GTCTGGCGTC ACGCCATCGG TACGCCAGCA TCGCAAGATA AACTGATCTA CGAAGAAAAA 
GACGATACCT ATTACGTCAG CCTGCATAAA ACGACCTCGA AGCACTATGT AGTCATTCAT 
TTGGCCAGCG CCACCACCAG TGAAGTTCGC CTGCTGGACG CGGAAATGGC CGATGCCGAG 
CCGTTTGTTT TTCTGCCGCG CCGCAAAGAT CACGAATACA GCCTTGATCA CTACCAGCAT 
CGTTTTTATC TGCGTTCCAA CCGCCACGGC AAAAACTTTG GCTTATACCG TACCCGTATG 
CGTGATGAGC AACAGTGGGA AGAGTTAATT CCGCCACGCG AAAACATCAT GCTGGAAGGG 
TTTACGCTGT TTACCGACTG GCTGGTGGTT GAAGAGCGTC AGCGCGGGTT AACCAGTTTG 
CGCCAAATTA ACCGCAAGAC CCGGGAAGTC ATTGGTATTG CCTTTGATGA TCCGGCCTAT 
GTGACCTGGA TTGCCTACAA TCCAGAACCT GAAACCGCGC GATTGCGTTA TGGTTATTCT 
TCCATGACTA CACCAGACAC TTTGTTTGAA CTGGATATGG ATACCGGTGA GCGTCGTGTA 
TTAAAACAAA CGGAAGTTCC TGGTTTTTAT GCGGCGAATT ACCGCAGTGA ACACCTGTGG 
ATAGTCGCCC GTGATGGCGT CGAAGTTCCG GTTTCGTTGG TCTACCATCG CAAACATTTT 
CGCAAAGGAC ACAACCCGTT GCTGGTGTAT GGCTATGGTT CTTACGGCGC AAGTATTGAT 
GCCGATTTCA GTTTTAGCCG CTTGAGTTTG TTAGATCGTG GCTTTGTCTA CGCCATTGTC 
CATGTTCGCG GCGGTGGTGA GCTGGGGCAA CAATGGTACG AAGACGGAAA ATTTCTGAAG 
AAGAAAAATA CGTTTAATGA TTATCTTGAT GCCTGCGATG CATTGTTAAA ACTGGGCTAT 
GGCTCTCCTT CGCTTTGTTA TGCGATGGGC GGGAGTGCGG GGGGCATGTT GATGGGCGTT 
GCAATTAATC AACGCCCGGA ATTATTCCAC GGCGTTATCG CCCAGGTACC GTTTGTTGAT 
GTTGTAACAA CGATGCTTGA TGAATCAATT CCTCTTACCA CTGGTGAGTT TGAAGAGTGG 
GGTAACCCGC AGGATCCGCA ATATTACGAG TACATGAAAA GCTACAGCCC GTATGACAAC 
GTCACCGCAC AGGCTTATCC GCATTTACTG GTAACGACCG GTTTGCACGA TTCTCAGGTG 
CAATATTGGG AACCGGCAAA ATGGGTCGCT AAATTGCGCG AGCTGAAAAC CGATGACCAT 
CTTTTATTGC TCTGTACCGA CATGGACTCA GGCCATGGCG GTAAATCTGG TCGCTTTAAA 
TCGTACGAAG GCGTAGCGAT GGAATATGCT TTTCTGGTCG CGCTGGCGCA GGGAACATTA 
CCCGCTACGC CTGCGGACTA A

Protein sequence

MLPKAARIPH AMTLHGDTRI DNYYWLRDDT RSQPEVLDYL QQENSYGHRV MASQQALQDR 
ILKEIIDRIP QREVSAPYIK NGYRYRHIYE PGCEYAIYQR QSAFSEEWDE WETLLDANKR 
AAHSEFYSMG GMAITPDNTI MALAEDFLSR RQYGIRFRNL ETGNWYPELL DNVEPSFVWA 
NDSWIFYYVR KHPVTLLPYQ VWRHAIGTPA SQDKLIYEEK DDTYYVSLHK TTSKHYVVIH 
LASATTSEVR LLDAEMADAE PFVFLPRRKD HEYSLDHYQH RFYLRSNRHG KNFGLYRTRM 
RDEQQWEELI PPRENIMLEG FTLFTDWLVV EERQRGLTSL RQINRKTREV IGIAFDDPAY 
VTWIAYNPEP ETARLRYGYS SMTTPDTLFE LDMDTGERRV LKQTEVPGFY AANYRSEHLW 
IVARDGVEVP VSLVYHRKHF RKGHNPLLVY GYGSYGASID ADFSFSRLSL LDRGFVYAIV 
HVRGGGELGQ QWYEDGKFLK KKNTFNDYLD ACDALLKLGY GSPSLCYAMG GSAGGMLMGV 
AINQRPELFH GVIAQVPFVD VVTTMLDESI PLTTGEFEEW GNPQDPQYYE YMKSYSPYDN 
VTAQAYPHLL VTTGLHDSQV QYWEPAKWVA KLRELKTDDH LLLLCTDMDS GHGGKSGRFK 
SYEGVAMEYA FLVALAQGTL PATPAD