Gene EcDH1_3368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3368
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3613607
End bp	3614851
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	54%
IMG OID
Product	protein of unknown function DUF1100 hydrolase family protein
Protein accession	ACX40988
Protein GI	260450566
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAGG CAAACCTGAG CGAAACCCTG TTCAAACCCC GCTTTAAACA TCCTGAAACC 
TCGACGCTAG TCCGCCGCTT TAATCACGGC GCACAACCGC CTGTGCAGTC GGCCCTTGAT 
GGTAAAACCA TCCCTCACTG GTATCGCATG ATTAACCGTC TGATGTGGAT CTGGCGCGGC 
ATTGACCCAC GCGAAATCCT CGACGTCCAG GCACGTATTG TGATGAGCGA TGCCGAACGT 
ACCGACGATG ATTTATACGA TACGGTGATT GGCTACCGTG GCGGCAACTG GATTTATGAG 
TGGGCCACCC AGGCGATGGT GTGGCAACAA AAAGCCTGTG CGGAAGACGA TCCGCAACTC 
AGTGGTCGTC ACTGGCTGCA TGCGGCTACG TTGTACAACA TTGCCGCCTA TCCTCATCTG 
AAAGGAGATG ACCTGGCCGA GCAAGCGCAG GCTTTGTCAA ACCGCGCCTA TGAAGAGGCC 
GCTCAGCGTC TACCGGGCAC GATGCGGCAG ATGGAGTTTA CCGTACCCGG CGGTGCGCCC 
ATCACCGGCT TTTTGCATAT GCCGAAAGGC GATGGCCCGT TCCCGACGGT ATTAATGTGT 
GGTGGTCTGG ATGCGATGCA GACGGACTAT TACAGCCTGT ATGAACGTTA TTTTGCGCCG 
CGCGGCATTG CGATGCTGAC TATTGATATG CCGTCGGTGG GCTTTTCTTC AAAATGGAAG 
CTCACCCAGG ACTCCAGCCT GTTGCATCAG CACGTCTTAA AGGCGCTGCC TAACGTACCG 
TGGGTGGATC ACACTCGCGT CGCGGCCTTT GGTTTCCGTT TCGGCGCTAA CGTTGCCGTG 
CGTCTGGCAT ACCTTGAATC GCCGCGTCTG AAAGCGGTTG CCTGTCTTGG TCCGGTAGTT 
CATACCCTGT TGAGTGATTT TAAGTGCCAG CAACAGGTGC CGGAAATGTA TCTTGACGTT 
CTGGCCAGTC GTTTGGGGAT GCATGATGCT TCCGATGAAG CGTTGCGCGT GGAGCTGAAT 
CGCTATTCAT TAAAAGTGCA AGGATTGCTG GGACGTCGCT GCCCAACGCC AATGTTATCA 
GGCTACTGGA AGAACGATCC GTTCAGCCCG GAAGAGGACT CACGCTTAAT CACCTCATCA 
TCTGCTGACG GTAAATTATT AGAGATCCCA TTTAACCCGG TGTATCGGAA TTTTGACAAA 
GGTCTTCAGG AAATCACCGA CTGGATCGAA AAACGCTTGT GTTAA

Protein sequence

MTQANLSETL FKPRFKHPET STLVRRFNHG AQPPVQSALD GKTIPHWYRM INRLMWIWRG 
IDPREILDVQ ARIVMSDAER TDDDLYDTVI GYRGGNWIYE WATQAMVWQQ KACAEDDPQL 
SGRHWLHAAT LYNIAAYPHL KGDDLAEQAQ ALSNRAYEEA AQRLPGTMRQ MEFTVPGGAP 
ITGFLHMPKG DGPFPTVLMC GGLDAMQTDY YSLYERYFAP RGIAMLTIDM PSVGFSSKWK 
LTQDSSLLHQ HVLKALPNVP WVDHTRVAAF GFRFGANVAV RLAYLESPRL KAVACLGPVV 
HTLLSDFKCQ QQVPEMYLDV LASRLGMHDA SDEALRVELN RYSLKVQGLL GRRCPTPMLS 
GYWKNDPFSP EEDSRLITSS SADGKLLEIP FNPVYRNFDK GLQEITDWIE KRLC