Gene EcDH1_3338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3338
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3590183
End bp	3591325
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	62%
IMG OID
Product	Integrase catalytic region
Protein accession	ACX40960
Protein GI	260450538
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.858997
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTGGG ATGCGAGAGA TACCATGTCA TTACGTACTG AGTTTGTTTT GTTCGCCTCG 
CAGGACGGGG CGAACATCCG TTCCCTCTGC CGTCGCTTCG GCATTTCACC TGCCACCGGC 
TACAAGTGGC TCCAGCGCTG GGCTCAGGAA GGTGCCGCCG GTCTTCAGGA CCGCCCGCGC 
ATTCCGCACC ATTCCCCGAA CCGCTCATCT GACGACATCA CGGCCCTGCT GCGTATGGCC 
CATGACCGTC ATGAACGCTG GGGAGCCCGC AAGATTAAGC GCTGGCTCGA GGACCAGGGG 
CACACCATGC CCGCCTTCAG CACCGTCCAT AACCTGATGG CCCGCCATGG CCTGCTGCCG 
GGCGCTTCAC CGGGCATTCC CGCCACGGGC CGGTTCGAAC ACGACGCGCC GAACCGCCTC 
TGGCAGATGG ATTTTAAGGG CCACTTTCCT TTTGGCGGTG GACGCTGCCA TCCGCTCACC 
CTGCTGGACG ACCACTCCCG TTTTTCCCTG TGCCTGGCGC ACTGTACCGA TGAACGGCGC 
GAGACCGTGC AGCAGCAGCT GGTCAGCGTG TTTGAGCGTT ACGGCCTGCC GGACCGGATG 
ACCATGGATA ACGGCTCACC GTGGGGCGAC ACCACCGGCA CCTGGACGGC GCTGGAGCTG 
TGGCTGATGC GCCTGGGTAT TCGGGTGGGG CACTCCCGGC CTTATCATCC GCAGACGCAG 
GGGAAGCTGG AGCGTTTTCA CCGCAGCCTG AAGGCGGAAG TGCTGCAGGG AAAATGGTTC 
GCAGACAGCG GTGAACTGCA GCGCGCCTTC GACCACTGGC GGACGGTCTA TAACCTTGAA 
CGCCCGCACG AGGCGCTGGA TATGGCGGTA CCGGGCTCGC GGTATCAGCC GTCAGCGCGG 
CAGTACAGCG GCAACACAAC GCCCCCGGAA TACGATGAAG GGGTGATGGT CAGGAAAGTG 
GATATCAGCG GAAAGCTGAG CGTGAAAGGG GTAAGTCTGA GCGCAGGCAA GGCGTTCAGG 
GGAGAACGGG TCGGGCTGAA GGAGATGCAG GAAGACGGCA GCTACGAGGT GTGGTGGTAC 
AGCACGAAAG TGGGGGTGAT CGACCTGAAG AAAAAGTCGA TCACCATGGG TAAAGGATGT 
TAA

Protein sequence

MPWDARDTMS LRTEFVLFAS QDGANIRSLC RRFGISPATG YKWLQRWAQE GAAGLQDRPR 
IPHHSPNRSS DDITALLRMA HDRHERWGAR KIKRWLEDQG HTMPAFSTVH NLMARHGLLP 
GASPGIPATG RFEHDAPNRL WQMDFKGHFP FGGGRCHPLT LLDDHSRFSL CLAHCTDERR 
ETVQQQLVSV FERYGLPDRM TMDNGSPWGD TTGTWTALEL WLMRLGIRVG HSRPYHPQTQ 
GKLERFHRSL KAEVLQGKWF ADSGELQRAF DHWRTVYNLE RPHEALDMAV PGSRYQPSAR 
QYSGNTTPPE YDEGVMVRKV DISGKLSVKG VSLSAGKAFR GERVGLKEMQ EDGSYEVWWY 
STKVGVIDLK KKSITMGKGC