Gene EcDH1_1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1544
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1682691
End bp	1683800
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	54%
IMG OID
Product	Mrp protein
Protein accession	ACX39212
Protein GI	260448790
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.575104
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAC AATCCCAGGC CAAATCACCA GAAGCCTTGC GCGCAATGGT CGCCGGGACA 
CTGGCCAATT TTCAGCACCC AACCCTGAAG CATAACCTCA CCACGCTGAA AGCGTTGCAC 
CATGTCGCCT GGATGGACGA CACGTTGCAT GTGGAACTGG TTATGCCGTT TGTCTGGCAT 
AGCGCGTTCG AAGAGTTAAA AGAGCAATGT AGCGCCGAAC TGCTGCGCAT CACCGGGGCG 
AAAGCTATCG ACTGGAAACT GTCGCATAAC ATAGCCACTC TGAAACGCGT GAAGAATCAG 
CCGGGAATTA ACGGTGTGAA GAACATTATC GCGGTGAGTT CCGGTAAAGG CGGCGTGGGT 
AAATCGTCCA CGGCGGTAAA CCTGGCACTG GCGCTGGCGG CAGAAGGGGC GAAAGTCGGC 
ATTCTGGACG CCGATATCTA CGGCCCATCA ATCCCAACAA TGTTGGGCGC AGAAAATCAG 
CGTCCAACTT CGCCGGACGG TACCCATATG GCACCGATTA TGTCTCATGG CCTGGCAACC 
AATTCAATTG GTTATCTGGT CACTGACGAC AATGCGATGG TGTGGCGTGG ACCGATGGCG 
AGCAAGGCGT TAATGCAGAT GTTGCAGGAA ACCTTGTGGC CGGATCTCGA CTATCTGGTG 
CTTGATATGC CGCCAGGCAC CGGTGACATT CAATTGACGC TGGCGCAAAA CATTCCAGTA 
ACCGGTGCAG TCGTGGTCAC CACCCCGCAG GACATCGCGC TGATCGATGC GAAAAAAGGC 
ATTGTGATGT TCGAGAAAGT CGAGGTTCCG GTGCTCGGTA TTGTCGAGAA CATGAGTGTG 
CATATTTGCA GTAACTGTGG TCACCATGAA CCGATTTTCG GTACCGGTGG TGCAGAGAAA 
CTGGCTGAAA AATACCATAC ACAGCTGCTG GGGCAGATGC CGTTACACAT CTCCTTACGT 
GAGGATCTCG ATAAAGGTAC GCCAACGGTT ATCAGCCGTC CGGAGAGCGA ATTTACCGCT 
ATCTACCGCC AGCTGGCTGA CCGCGTTGCA GCTCAGCTCT ACTGGCAGGG TGAAGTCATT 
CCAGGCGAGA TTTCCTTCCG CGCGGTCTAA

Protein sequence

MNEQSQAKSP EALRAMVAGT LANFQHPTLK HNLTTLKALH HVAWMDDTLH VELVMPFVWH 
SAFEELKEQC SAELLRITGA KAIDWKLSHN IATLKRVKNQ PGINGVKNII AVSSGKGGVG 
KSSTAVNLAL ALAAEGAKVG ILDADIYGPS IPTMLGAENQ RPTSPDGTHM APIMSHGLAT 
NSIGYLVTDD NAMVWRGPMA SKALMQMLQE TLWPDLDYLV LDMPPGTGDI QLTLAQNIPV 
TGAVVVTTPQ DIALIDAKKG IVMFEKVEVP VLGIVENMSV HICSNCGHHE PIFGTGGAEK 
LAEKYHTQLL GQMPLHISLR EDLDKGTPTV ISRPESEFTA IYRQLADRVA AQLYWQGEVI 
PGEISFRAV