Gene EcHS_A2063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2063
Symbol	dcm
ID	5594136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2050706
End bp	2052124
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	52%
IMG OID	640921204
Product	DNA cytosine methylase
Protein accession	YP_001458748
Protein GI	157161430
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.00482699
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGAAA ATATATCAGT AACCGATTCA TACAGCACCG GGAATGCCGC ACAGGCAATG 
CTGGAGAAAC TGCTGCAAAT TTATGATGTT AAAACGTTGG TGGCGCAGCT TAATGGCGTA 
GGTGAGAATC ACTGGAGCGC GGCAATTTTA AAACGTGCGC TGGCGAATGA CTCGGCATGG 
CACCGTTTAA GTGAGAAAGA GTTCGCCCAT CTGCAAACGT TATTACCCAA ACCACCGGCA 
CATCATCCGC ATTATGCGTT TCGCTTTATC GATCTATTCG CCGGAATTGG CGGCATCCGT 
CGCGGTTTTG AATCGATTGG CGGACAGTGC GTGTTTACCA GCGAATGGAA CAAACATGCG 
GTACGCACTT ATAAAGCCAA CCATTATTGC GATCCGGCGA CGCATCATTT TAATGAAGAT 
ATCCGCGACA TCACCCTCAG CCATAAAGAA GGCGTGAGTG ATGAGGCGGC GGCGGAACAT 
ATTCGTCAAC ACATTCCTGA ACACGATGTT TTACTGGCCG GTTTCCCTTG TCAGCCATTT 
TCGCTGGCTG GCGTATCGAA AAAGAACTCG CTCGGGCGGG CGCACGGTTT TGCCTGCGAT 
ACCCAGGGCA CGCTGTTTTT TGATGTGGTA CGCATTATCG ACGCGCGTCG TCCGGCGATG 
TTTGTGCTCG AAAACGTCAA AAACCTGAAA AGTCACGACC AGGGTAAAAC GTTCCGCATC 
ATCATGCAGA CGCTGGACGA ACTGGGCTAT GACGTGGCTG ATGCAGAAGA TAATGGGCCA 
GACGATCCGA AAATCATCGA CGGCAAACAT TTTCTGCCGC AGCACCGTGA ACGCATCGTG 
CTGGTGGGTT TTCGTCGCGA TCTGAATCTG AAAGCCGATT TTACCCTGCG TGATATCAGC 
GAATGTTTCC CTGCGCAGCG AGTGACGCTG GCGCAGCTGT TGGACCCGAT GGTCGAGGCG 
AAATATATCC TGACGCCGGT GCTGTGGAAG TACCTCTATC GATATGCGAA AAAACATCAG 
ACGCGCGGTA ACGGCTTCGG TTATGGAATG GTTTATCCGA ACAATCCGCA AAGCGTCACG 
CGTACGCTGT CTGCGCGTTA TTACAAAGAT GGCGCGGAAA TTTTAATCGA TCGCGGCTGG 
GATATGGCCA AAGGTGAGAA AGACTTTGAC GATCCGCAGA ATCAGCAACA TCGTCCACGT 
CGGTTAACGC CTCGGGAATG CGCGCGCTTA ATGGGTTTTG AAGCGCCGGG AGAAGCGAAA 
TTCCGCATTC CGGTTTCGGA CACTCAGGCC TATCGCCAGT TCGGTAACTC GGTGGTCGTG 
CCGGTCTTTG CCGCGGTGGC AAAACTGCTT GAGCCAAAAA TCAAACAGGC GGTGGCGTTG 
CGTCAGCAAG AGGCACAACA TGGCCGACGT TCACGATAA

Protein sequence

MQENISVTDS YSTGNAAQAM LEKLLQIYDV KTLVAQLNGV GENHWSAAIL KRALANDSAW 
HRLSEKEFAH LQTLLPKPPA HHPHYAFRFI DLFAGIGGIR RGFESIGGQC VFTSEWNKHA 
VRTYKANHYC DPATHHFNED IRDITLSHKE GVSDEAAAEH IRQHIPEHDV LLAGFPCQPF 
SLAGVSKKNS LGRAHGFACD TQGTLFFDVV RIIDARRPAM FVLENVKNLK SHDQGKTFRI 
IMQTLDELGY DVADAEDNGP DDPKIIDGKH FLPQHRERIV LVGFRRDLNL KADFTLRDIS 
ECFPAQRVTL AQLLDPMVEA KYILTPVLWK YLYRYAKKHQ TRGNGFGYGM VYPNNPQSVT 
RTLSARYYKD GAEILIDRGW DMAKGEKDFD DPQNQQHRPR RLTPRECARL MGFEAPGEAK 
FRIPVSDTQA YRQFGNSVVV PVFAAVAKLL EPKIKQAVAL RQQEAQHGRR SR