Gene EcDH1_2223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2223
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2381847
End bp	2383190
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	53%
IMG OID
Product	protein of unknown function DUF1338
Protein accession	ACX39872
Protein GI	260449450
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.350625
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAACA GCATCACGGC GGATGAGATT CGGGAACAGT TTTCGCAGGC AATGTCAGCC 
ATGTACCAGC AAGAAGTTCC GCAATATGGC ACGCTGCTGG AACTGGTAGC TGATGTGAAT 
CTGGCTGTGC TGGAAAACAA TCCTCAACTG CACGAAAAAA TGGTAAATGC AGACGAGCTG 
GCGCGACTGA ATGTTGAACG TCATGGGGCG ATTCGCGTTG GGACTGCACA AGAGCTTGCT 
ACTCTTCGGC GGATGTTTGC CATTATGGGG ATGTACCCGG TGAGCTATTA CGATCTCTCG 
CAGGCAGGGG TGCCGGTACA TTCGACAGCA TTTCGGCCCA TTGATGATGC TTCTCTGGCG 
CGTAATCCCT TCCGCGTTTT TACCTCCTTA CTCCGCCTTG AGCTTATCGA GAACGAAATT 
TTGCGCCAGA AAGCGGCGGA GATTCTGCGT CAGCGCGATA TCTTCACCCC ACGTTGTCGA 
CAACTGTTAG AGGAATATGA GCAGCAGGGC GGTTTTAACG AAACACAGGC ACAGGAGTTT 
GTGCAGGAAG CCCTGGAAAC GTTTCGCTGG CACCAGTCAG CAACGGTAGA TGAAGAAACC 
TATCGCGCAT TGCACAACGA ACATCGGTTG ATTGCTGATG TGGTCTGTTT TCCTGGATGC 
CATATCAACC ACCTGACGCC ACGTACGCTG GATATTGACC GGGTGCAGTC GATGATGCCT 
GAATGCGGAA TTGAACCCAA AATTCTCATC GAGGGGCCGC CGCGCCGCGA GGTACCGATT 
TTACTACGCC AGACCAGCTT TAAAGCACTG GAAGAGACGG TGTTGTTTGC GGGGCAGAAA 
CAGGGCACGC ATACCGCGCG CTTTGGTGAA ATTGAGCAGC GTGGCGTGGC ATTAACGCCG 
AAAGGGCGAC AACTGTATGA TGATCTTCTG CGTAACGCTG GAACCGGGCA GGATAATCTC 
ACTCACCAAA TGCATTTACA GGAAACCTTC CGCACTTTTC CTGACAGTGA GTTTTTAATG 
CGTCAGCAAG GGTTGGCATG GTTCCGGTAC CGTCTGACGC CTTCGGGTGA GGCGCATCGT 
CAGGCGATTC ATCCTGGAGA CGATCCACAG CCCTTAATTG AACGTGGTTG GGTAGTGGCG 
CAACCCATCA CCTATGAAGA TTTCTTGCCC GTTAGCGCGG CGGGGATCTT CCAGTCAAAT 
CTGGGTAATG AAACGCAGAC ACGCAGTCAC GGTAATGCCA GTCGCGAAGC ATTTGAGCAG 
GCGTTGGGTT GTCCGGTTTT GGATGAGTTC CAGCTTTACC AGGAAGCGGA AGAACGCAGT 
AAACGTCGCT GTGGTTTGCT TTAA

Protein sequence

MANSITADEI REQFSQAMSA MYQQEVPQYG TLLELVADVN LAVLENNPQL HEKMVNADEL 
ARLNVERHGA IRVGTAQELA TLRRMFAIMG MYPVSYYDLS QAGVPVHSTA FRPIDDASLA 
RNPFRVFTSL LRLELIENEI LRQKAAEILR QRDIFTPRCR QLLEEYEQQG GFNETQAQEF 
VQEALETFRW HQSATVDEET YRALHNEHRL IADVVCFPGC HINHLTPRTL DIDRVQSMMP 
ECGIEPKILI EGPPRREVPI LLRQTSFKAL EETVLFAGQK QGTHTARFGE IEQRGVALTP 
KGRQLYDDLL RNAGTGQDNL THQMHLQETF RTFPDSEFLM RQQGLAWFRY RLTPSGEAHR 
QAIHPGDDPQ PLIERGWVVA QPITYEDFLP VSAAGIFQSN LGNETQTRSH GNASREAFEQ 
ALGCPVLDEF QLYQEAEERS KRRCGLL