Gene EcDH1_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1954
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2108292
End bp	2109404
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	55%
IMG OID
Product	protein of unknown function UPF0118
Protein accession	ACX39611
Protein GI	260449189
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.133227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAATG TTCGTCAGCC CAGGGATGTC GCACAAATTC TGCTTTCGGT GCTGTTTTTA 
GCCATCATGA TTGTGGCATG TCTGTGGATT GTTCAACCCT TTATTCTCGG CTTTGCATGG 
GCCGGTACGG TGGTTATCGC CACCTGGCCG GTATTGTTAC GTTTGCAAAA GATCATGTTT 
GGCCGCCGCT CTCTCGCCGT TCTGGTGATG ACGCTGTTAT TAGTGATGGT GTTTATCATC 
CCTATTGCTT TGCTGGTTAA CAGTATCGTC GACGGCAGCG GCCCGCTAAT TAAAGCCATT 
TCCAGCGGTG ACATGACGTT ACCCGATCTG GCGTGGCTTA ATACCATTCC GGTGATTGGC 
GCGAAGCTGT ATGCAGGCTG GCACAACTTG CTGGATATGG GGGGGACGGC GATCATGGCG 
AAAGTCCGCC CTTATATTGG CACCACCACC ACCTGGTTCG TTGGGCAGGC GGCGCATATC 
GGGCGCTTTA TGGTGCATTG TGCGCTGATG CTTCTCTTCA GTGCCCTGCT GTACTGGCGC 
GGTGAACAGG TGGCACAAGG CATTCGCCAT TTTGCAACCC GTCTGGCAGG CGTTCGCGGA 
GATGCCGCCG TGCTGCTGGC GGCACAGGCT ATCCGCGCGG TGGCGCTGGG TGTGGTGGTG 
ACGGCGTTAG TACAGGCAGT GCTTGGCGGT ATCGGCCTCG CCGTATCCGG CGTACCTTAT 
GCAACGTTGC TAACGGTGTT AATGATCCTC TCCTGCCTTG TCCAGCTTGG CCCGTTGCCG 
GTACTGATTC CGGCGATTAT CTGGCTCTAC TGGACTGGCG ATACCACCTG GGGAACGGTA 
TTGTTAGTGT GGAGCGGTGT GGTTGGCACG CTGGATAACG TCATCCGCCC AATGTTAATT 
CGCATGGGTG CCGATTTACC GCTGATCCTG ATTCTCTCTG GCGTTATTGG TGGTTTGATT 
GCTTTCGGGA TGATCGGTCT GTTTATTGGT CCGGTTCTGT TAGCCGTTTC CTGGCGTCTG 
TTTGCCGCGT GGGTGGAAGA AGTCCCGCCG CCGACGGACC AACCGGAAGA AATTCTCGAA 
GAACTTGGCG AAATCGAGAA ACCGAATAAG TAA

Protein sequence

MVNVRQPRDV AQILLSVLFL AIMIVACLWI VQPFILGFAW AGTVVIATWP VLLRLQKIMF 
GRRSLAVLVM TLLLVMVFII PIALLVNSIV DGSGPLIKAI SSGDMTLPDL AWLNTIPVIG 
AKLYAGWHNL LDMGGTAIMA KVRPYIGTTT TWFVGQAAHI GRFMVHCALM LLFSALLYWR 
GEQVAQGIRH FATRLAGVRG DAAVLLAAQA IRAVALGVVV TALVQAVLGG IGLAVSGVPY 
ATLLTVLMIL SCLVQLGPLP VLIPAIIWLY WTGDTTWGTV LLVWSGVVGT LDNVIRPMLI 
RMGADLPLIL ILSGVIGGLI AFGMIGLFIG PVLLAVSWRL FAAWVEEVPP PTDQPEEILE 
ELGEIEKPNK