Gene EcDH1_2156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2156
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2309655
End bp	2310974
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	52%
IMG OID
Product	protein of unknown function DUF187
Protein accession	ACX39808
Protein GI	260449386
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.360071
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATCT GCTCCCGAAA CAAGAAATTA ACGATTAGAA GACCAGCGAT ACTAGTTGCA 
CTGGCACTTT TACTGTGTAG TTGTAAAAGC ACGCCTCCAG AGTCCATGGT GACACCACCA 
GCAGGTTCAA AGCCACCAGC CACGACGCAA CAATCGTCAC AACCGATGCG TGGCATCTGG 
CTGGCCACGG TTTCTCGGCT CGACTGGCCA CCGGTTTCCT CGGTTAACAT TAGTAACCCC 
ACCAGCCGGG CCCGTGTACA ACAACAGGCG ATGATCGACA AACTGGATCA TCTGCAACGT 
CTCGGCATAA ACACGGTCTT TTTCCAGGTC AAGCCGGACG GTACCGCCCT GTGGCCATCG 
AAAATTTTGC CGTGGTCCGA TCTTATGACC GGTAAGATTG GTGAAAATCC GGGTTACGAT 
CCGCTGCAAT TTATGCTCGA CGAAGCCCAC AAGCGTGGGA TGAAAGTACA CGCCTGGTTT 
AACCCCTATC GCGTATCGGT TAATACGAAG CCCGGTACTA TCAGGGAACT GAATAGCACT 
CTGTCTCAAC AACCGGCGAG CGTCTATGTG CAACACCGCG ACTGGATCAG AACGTCTGGC 
GATCGCTTTG TCCTCGACCC GGGCATCCCT GAGGTTCAGG ACTGGATCAC ATCAATAGTC 
GCAGAAGTGG TTTCCCGCTA TCCCGTAGAT GGCGTGCAGT TTGACGACTA TTTCTATACG 
GAGTCACCGG GTTCACGGCT AAATGATAAC GAAACGTACC GTAAATACGG AGGCGCATTT 
GCGTCAAAAG CAGACTGGCG GCGCAACAAT ACTCAGCAGT TAATTGCAAA GGTATCGCAC 
ACCATTAAAA GCATTAAGCC GGGAGTCGAA TTTGGTGTTA GCCCGGCAGG CGTGTGGCGT 
AACCGATCAC ACGATCCGCT CGGTTCCGAT ACCCGAGGCG CGGCAGCCTA TGACGAATCC 
TACGCTGACA CCCGTCGATG GGTGGAACAA GGATTGCTGG ATTACATTGC TCCCCAAATT 
TACTGGCCGT TCTCACGGAG TGCCGCGCGT TATGACGTGT TGGCAAAATG GTGGGCGGAT 
GTCGTTAAAC CGACCAGGAC CCGCCTGTAT ATCGGTATCG CCTTCTATAA AGTGGGTGAA 
CCTTCAAAGA TAGAGCCAGA CTGGATGATT AACGGCGGCG TACCGGAACT GAAAAAGCAG 
CTCGATCTTA ACGATGCTGT GCCCGAAATT AGCGGCACCA TCTTGTTCCG TGAGGACTAT 
CTGAATAAAC CGCAGACTCA ACAAGCGGTC AGCTATCTGC AAAGTCGCTG GGGCAGTTAA

Protein sequence

MDICSRNKKL TIRRPAILVA LALLLCSCKS TPPESMVTPP AGSKPPATTQ QSSQPMRGIW 
LATVSRLDWP PVSSVNISNP TSRARVQQQA MIDKLDHLQR LGINTVFFQV KPDGTALWPS 
KILPWSDLMT GKIGENPGYD PLQFMLDEAH KRGMKVHAWF NPYRVSVNTK PGTIRELNST 
LSQQPASVYV QHRDWIRTSG DRFVLDPGIP EVQDWITSIV AEVVSRYPVD GVQFDDYFYT 
ESPGSRLNDN ETYRKYGGAF ASKADWRRNN TQQLIAKVSH TIKSIKPGVE FGVSPAGVWR 
NRSHDPLGSD TRGAAAYDES YADTRRWVEQ GLLDYIAPQI YWPFSRSAAR YDVLAKWWAD 
VVKPTRTRLY IGIAFYKVGE PSKIEPDWMI NGGVPELKKQ LDLNDAVPEI SGTILFREDY 
LNKPQTQQAV SYLQSRWGS