Gene EcDH1_1473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1473
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1594467
End bp	1596227
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	53%
IMG OID
Product	type III restriction protein res subunit
Protein accession	ACX39143
Protein GI	260448721
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00000087246
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTTA CACTTCGCCC ATATCAGCAA GAAGCCGTGG ATGCCACGCT CAACCATTTT 
CGTCGTCATA AAACCCCTGC CGTTATCGTG CTGCCCACCG GCGCAGGTAA AAGCCTGGTG 
ATAGCGGAAC TGGCACGGCT GGCTCGTGGT CGCGTGCTGG TGCTGGCACA CGTTAAAGAA 
CTGGTGGCGC AAAACCATGC AAAGTATCAG GCGCTGGGGC TGGAAGCCGA TATTTTTGCC 
GCCGGGCTAA AGCGCAAAGA GAGCCACGGT AAAGTGGTAT TTGGCAGCGT GCAGTCTGTC 
GCCCGTAATC TTGATGCCTT TCAGGGTGAA TTTTCGCTGT TGATTGTCGA TGAATGTCAC 
CGTATTGGTG ACGATGAAGA GAGCCAGTAT CAGCAAATCC TCACTCACCT GACAAAAGTG 
AATCCCCACT TACGCCTGCT GGGGCTGACT GCCACGCCTT TTCGATTGGG CAAAGGCTGG 
ATCTACCAGT TTCATTATCA CGGCATGGTA CGCGGCGATG AGAAAGCCCT TTTCCGTGAC 
TGCATTTATG AGCTGCCGCT GCGTTATATG ATTAAACACG GCTATCTGAC GCCGCCAGAA 
CGACTGGATA TGCCAGTAGT GCAATACGAT TTCAGCCGCT TGCAGGCACA GAGTAACGGG 
CTGTTCAGCG AAGCCGATCT CAACCGTGAG CTGAAAAAAC AACAACGTAT TACCCCGCAC 
ATCATCAGCC AGATTATGGA GTTTGCTGCA ACGCGCAAAG GGGTGATGAT TTTTGCCGCG 
ACGGTTGAAC ACGCAAAAGA GATTGTGGGA TTACTGCCTG CCGAAGATGC AGCACTGATT 
ACTGGCGACA CCCCCGGCGC TGAGCGCGAT GTGTTAATTG AAAATTTTAA AGCCCAGCGT 
TTTCGCTATC TGGTCAACGT CGCGGTACTG ACCACCGGAT TTGACGCCCC GCACGTCGAT 
CTTATCGCCA TTCTGCGCCC TACCGAATCA GTGAGTCTTT ACCAACAAAT TGTCGGGCGC 
GGTCTGCGTC TCGCTCCGGG CAAGACTGAT TGCTTAATTC TTGATTATGC GGGTAATCCT 
CACGATCTCT ACGCGCCGGA AGTTGGTACA CCAAAAGGCA AAAGTGACAA CGTTCCGGTA 
CAGGTTTTCT GCCCTGCCTG CGGTTTTGCC AACACCTTTT GGGGGAAAAC GACCGCCGAC 
GGGACATTGA TTGAACACTT TGGTCGTCGC TGTCAGGGAT GGTTTGAAGA TGACGACGGT 
CATCGCGAAC AATGTGACTT CCGTTTCCGT TTTAAAAATT GCCCGCAATG TAACGCGGAA 
AACGATATTG CCGCCCGCCG CTGCCGCGAA TGTGACACCG TACTGGTTGA TCCGGACGAT 
ATGTTAAAAG CGGCGCTACG ACTGAAAGAC GCGCTGGTAT TACGCTGTAG CGGCATGTCT 
TTGCAACATG GGCACGACGA GAAAGGCGAA TGGTTGAAAA TCACCTATTA CGATGAAGAC 
GGCGCGGATG TGAGTGAGCG TTTCCGTCTG CAAACACCTG CCCAGCGTAC CGCCTTCGAG 
CAGCTTTTTA TCCGCCCGCA TACGCGCACA CCGGGCATCC CGCTGCGCTG GATCACCGCC 
GCCGATATCC TCGCCCAGCA AGCCTTATTG CGACACCCGG ATTTTGTCGT CGCCCGCATG 
AAAGGCCAGT ACTGGCAGGT GCGTGAAAAA GTGTTCGATT ACGAAGGTCG TTTTCGTCTG 
GCGCACGAAT TACGCGGTTA A

Protein sequence

MIFTLRPYQQ EAVDATLNHF RRHKTPAVIV LPTGAGKSLV IAELARLARG RVLVLAHVKE 
LVAQNHAKYQ ALGLEADIFA AGLKRKESHG KVVFGSVQSV ARNLDAFQGE FSLLIVDECH 
RIGDDEESQY QQILTHLTKV NPHLRLLGLT ATPFRLGKGW IYQFHYHGMV RGDEKALFRD 
CIYELPLRYM IKHGYLTPPE RLDMPVVQYD FSRLQAQSNG LFSEADLNRE LKKQQRITPH 
IISQIMEFAA TRKGVMIFAA TVEHAKEIVG LLPAEDAALI TGDTPGAERD VLIENFKAQR 
FRYLVNVAVL TTGFDAPHVD LIAILRPTES VSLYQQIVGR GLRLAPGKTD CLILDYAGNP 
HDLYAPEVGT PKGKSDNVPV QVFCPACGFA NTFWGKTTAD GTLIEHFGRR CQGWFEDDDG 
HREQCDFRFR FKNCPQCNAE NDIAARRCRE CDTVLVDPDD MLKAALRLKD ALVLRCSGMS 
LQHGHDEKGE WLKITYYDED GADVSERFRL QTPAQRTAFE QLFIRPHTRT PGIPLRWITA 
ADILAQQALL RHPDFVVARM KGQYWQVREK VFDYEGRFRL AHELRG