Gene EcDH1_0740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0740
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	785360
End bp	786496
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID
Product	oxygen-independent coproporphyrinogen III oxidase
Protein accession	ACX38424
Protein GI	260448002
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTAAAT TACCTCCGCT GAGTCTCTAC ATTCACATCC CGTGGTGCGT GCAGAAATGC 
CCGTACTGCG ATTTCAACTC TCACGCGTTG AAAGGAGAAG TGCCGCACGA CGATTATGTT 
CAGCATCTGC TTAACGATCT GGACAACGAT GTGGCTTACG CTCAGGGCCG TGAAGTAAAG 
ACAATCTTTA TTGGCGGTGG TACGCCGAGC CTGCTTTCCG GCCCGGCGAT GCAAACGCTG 
CTGGACGGCG TGCGTGCGCG TTTGCCGCTG GCAGCGGATG CAGAAATTAC TATGGAAGCG 
AACCCTGGCA CGGTAGAAGC CGATCGCTTT GTCGATTATC AGCGTGCTGG TGTGAACCGC 
ATCTCTATTG GTGTGCAGAG TTTTAGCGAA GAAAAGCTGA AACGACTTGG GCGTATTCAT 
GGCCCGCAAG AAGCGAAACG CGCGGCGAAG CTGGCGAGCG GTTTAGGGTT ACGTAGCTTT 
AACCTTGATT TGATGCATGG GCTGCCGGAT CAATCACTGG AAGAGGCGCT TGGCGATCTA 
CGCCAGGCCA TTGAACTGAA TCCGCCGCAT CTTTCCTGGT ATCAACTGAC CATCGAACCC 
AATACGCTGT TTGGTTCGCG ACCACCGGTG CTGCCGGACG ATGACGCGTT GTGGGATATA 
TTCGAACAGG GGCATCAGTT ATTAACCGCA GCGGGTTATC AGCAATATGA AACTTCCGCT 
TACGCCAAAC CCGGTTATCA GTGCCAGCAC AATCTCAACT ACTGGCGCTT TGGTGACTAC 
ATCGGTATTG GCTGCGGCGC ACACGGCAAA GTGACCTTCC CGGATGGGCG CATTCTGCGT 
ACCACCAAAA CGCGTCATCC GCGTGGTTTT ATGCAAGGAA GGTATCTGGA AAGCCAGCGT 
GATGTCGAAG CCACAGATAA GCCGTTTGAG TTCTTTATGA ATCGCTTCCG TCTGCTGGAG 
GCCGCGCCGC GCGTGGAGTT TATTGCGTAT ACCGGGCTTT GCGAAGATGT GATTCGCCCA 
CAGTTAGACG AGGCGATTGC CCAGGGTTAT CTCACCGAAT GTGCGGATTA CTGGCAGATA 
ACGGAACATG GGAAGCTGTT TTTAAATTCG CTGCTGGAGC TTTTTCTGGC TGAGTAA

Protein sequence

MVKLPPLSLY IHIPWCVQKC PYCDFNSHAL KGEVPHDDYV QHLLNDLDND VAYAQGREVK 
TIFIGGGTPS LLSGPAMQTL LDGVRARLPL AADAEITMEA NPGTVEADRF VDYQRAGVNR 
ISIGVQSFSE EKLKRLGRIH GPQEAKRAAK LASGLGLRSF NLDLMHGLPD QSLEEALGDL 
RQAIELNPPH LSWYQLTIEP NTLFGSRPPV LPDDDALWDI FEQGHQLLTA AGYQQYETSA 
YAKPGYQCQH NLNYWRFGDY IGIGCGAHGK VTFPDGRILR TTKTRHPRGF MQGRYLESQR 
DVEATDKPFE FFMNRFRLLE AAPRVEFIAY TGLCEDVIRP QLDEAIAQGY LTECADYWQI 
TEHGKLFLNS LLELFLAE