Gene EcDH1_1506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1506
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1633892
End bp	1635049
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	54%
IMG OID
Product	protein of unknown function DUF418
Protein accession	ACX39176
Protein GI	260448754
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.253618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCGCA ACGTCACGCT CGATTTTGTT CGCGGCGTCG CCATTCTGGG GATCCTGCTA 
TTAAACATCA GCGCCTTTGG GCTACCAAAG GCGGCTTATC TCAATCCCGC CTGGTACGGT 
GCTATTACGC CGCGGGATGC ATGGACTTGG GCATTTCTTG ATCTCATCGG CCAGGTGAAA 
TTCCTCACGC TTTTTGCGCT ACTGTTTGGT GCGGGCCTGC AAATGTTGCT GCCCCGTGGC 
AGACGCTGGA TCCAGTCGCG GTTAACGCTG TTAGTCTTGT TGGGCTTTAT TCACGGTTTA 
TTGTTCTGGG ACGGCGATAT TTTGCTGGCT TACGGGCTGG TGGGCTTAAT CTGCTGGCGG 
CTGGTGCGCG ATGCGCCATC GGTAAAAAGC CTGTTTAATA CAGGCGTCAT GCTTTATCTG 
GTGGGGCTTG GCGTTTTGCT GTTATTGGGG CTGATTTCCG ACAGCCAGAC CAGCCGCGCC 
TGGACGCCGG ATGCATCGGC TATTTTGTAT GAAAAATACT GGAAGCTTCA CGGCGGCGTT 
GAAGCGATCA GTAATCGTGC CGATGGTGTT GGCAACAGTT TACTGGCACT GGGCGCACAG 
TATGGCTGGC AACTGGCAGG GATGATGCTC ATTGGTGCGG CGCTGATGCG CAGCGGCTGG 
CTGAAAGGGC AGTTCAGCTT ACGTCACTAT CGTCGTACTG GTTTTGTGCT GGTGGCGATT 
GGGGTGACCA TTAACCTTCC TGCCATCGCC CTGCAATGGC AGCTGGACTG GGCGTATCGC 
TGGTGTGCCT TCTTACTTCA AATGCCGCGG GAACTGAGTG CGCCGTTTCA GGCGATTGGC 
TATGCGTCGC TGTTTTATGG CTTCTGGCCG CAATTGAGCC GCTTTAAGCT GGTGCTTGCG 
ATCGCCTGCG TCGGACGGAT GGCGCTGACC AACTATCTAT TGCAAACGCT GATTTGTACC 
ACGCTTTTTT ACCACCTCGG TTTGTTTATG CATTTTGACC GCCTGGAGCT GCTGGCGTTT 
GTTATTCCGG TATGGCTGGC GAATATCCTC TTCTCTGTTA TCTGGCTGCG TTACTTCCGC 
CAGGGGCCGG TGGAATGGCT CTGGCGTCAG TTAACTTTGC GTGCTGCCGG ACCGGCAATA 
TCTAAAACAT CAAGATAA

Protein sequence

MERNVTLDFV RGVAILGILL LNISAFGLPK AAYLNPAWYG AITPRDAWTW AFLDLIGQVK 
FLTLFALLFG AGLQMLLPRG RRWIQSRLTL LVLLGFIHGL LFWDGDILLA YGLVGLICWR 
LVRDAPSVKS LFNTGVMLYL VGLGVLLLLG LISDSQTSRA WTPDASAILY EKYWKLHGGV 
EAISNRADGV GNSLLALGAQ YGWQLAGMML IGAALMRSGW LKGQFSLRHY RRTGFVLVAI 
GVTINLPAIA LQWQLDWAYR WCAFLLQMPR ELSAPFQAIG YASLFYGFWP QLSRFKLVLA 
IACVGRMALT NYLLQTLICT TLFYHLGLFM HFDRLELLAF VIPVWLANIL FSVIWLRYFR 
QGPVEWLWRQ LTLRAAGPAI SKTSR