Gene EcE24377A_0286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0286
Symbol
ID	5586832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	307639
End bp	309348
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	54%
IMG OID	640924011
Product	N4/N6-methyltransferase family protein
Protein accession	YP_001461440
Protein GI	157157373
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID	[TIGR00497] type I restriction system adenine methylase (hsdM)

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAACG CTGAACAGCT ATTTCTGAAC GAGCTGGATA ACAAATTCTG GAAGGCCGCC 
GACAAACTGC GCGCCAATAT GGATGCCGCC AACTACAAGC ATGTGGTGCT GGGGCTAATC 
TTCCTGAAGT ATGTTTCTGA TGCCTTCGAG GCGCGTCAGC AGGAGCTGAC GACCCTGTTC 
CGCGATGTCG GTAATCCCGA CAACATCTAC GCCATGTCGC GCGATGATTA CGGTTCCGAC 
GAAGAATACG CTCAGGCTAT CCAGGAAGAG CTGGAAGTTG AAGATTACTA CACCGAAAAG 
AACATCTTCT GGGTGCCAAA AGCCGCGCGC TGGGACACGC TGAAAAACAA AGCCATGTTG 
CCGACCGGCA CCGTGCTGTG GGTGGATGAA ACCACCGGCA AGGATGTGAC GCTGCGCTCT 
GTGTCCTGGC TGGTGGATAA CGCGCTCGAT GAAATCGAAA AAACCAACCC GAAGCTGAAA 
GGTATTCTGA ACCGTATCAG CCAGTATCAA TTGGGCAACG AAGTGTTGAC CGGGCTGATT 
AATACTTTCT CTGACGCCAA CTTCAGCAAC CCGGAATATA ACGGCGAGAA GCTCAACTTA 
AAGAGCAAAG ATATTCTCGG TCACGTGTAC GAATATTTCC TCGGTCAGTT CGCGCTGGCG 
GAAGGTAAGC AGGGCGGCCA GTATTACACG CCAAAAAGTA TCGTCACCCT GATTGTTGAA 
ATGCTGCAAC CGTATAACGG GCGCGTGTAT GACCCGGCGA TGGGTTCCGG CGGGTTCTTT 
GTTTCCAGCG ACCGTTTTAT CGAAGAGCAC GCGGGCGAGA AGCAGTACAA CGCCGCCGAG 
CAGAAGCGCA ATATCTCTGT TTACGGCCAG GAGTCGAACC CGACTACCTG GAAGCTGGCG 
GCAATGAATA TGGCGATCCG GGGTATCGAC TTTAACTTCG GCAGCAAAAA CGCCGACACC 
CTGCTGGACG ACCAGCACCC GGATCTGCGA GCTGACTTCG TGATGGCGAA CCCGCCGTTC 
AACATGAAGG AGTGGTGGAA CGCCAAGCTG GAAAACGACG TGCGCTGGAA ATACGGCACA 
CCGCCGCAGG GCAACGCCAA CTTTGCGTGG ATGCAGCACA TGATCCATCA CCTTGCGCCA 
AAAGGTTCGA TGGCGCTGCT GCTGGCGAAC GGTTCGATGA GCTCCAACAC CAACAACGAA 
GGCGAAATCC GCCGTAACCT GATCAAAGCC GATTTGGTCG AGTGCATGGT GGCGCTACCG 
GGCCAGCTCT TTACCAACAC CCAAATCCCG GCCTGTATCT GGTTCCTGAC CAAAGACAAA 
TCCAGCGGCA ACGGCAAAGC GCACCGCAAA GGCGAAGTGC TGTTTATCGA CGCCCGCAAG 
ATTGGCTTTA TGAAAGACCG CGTGCTGCGT GACTTTACTC GTGAAGATAT CGCCAGAATT 
GCCGACACCT TCCACAAATG GCAGGCAGAT AAAGAGTACG AAGACGAAGC CGGATTCTGC 
TTCTCAGCAA CGCTGGAGGA TATCCAGAAA AACGACTTTG TGCTGACCCC TGGGCGCTAC 
GTTGGTGCCG CCGAGCAAGC TGAAGATGAT GAACCGTTTG CCGAGAAGAT GGCGCGCCTG 
ACGGCGCAGC TTAAAGGTCA GCTTGAAGAG AGCGCGAAGT TGGAAGCGCA GATTAAGGCG 
AATCTGGGGG GGCTGGGTTA TGAGTTCTGA

Protein sequence

MNNAEQLFLN ELDNKFWKAA DKLRANMDAA NYKHVVLGLI FLKYVSDAFE ARQQELTTLF 
RDVGNPDNIY AMSRDDYGSD EEYAQAIQEE LEVEDYYTEK NIFWVPKAAR WDTLKNKAML 
PTGTVLWVDE TTGKDVTLRS VSWLVDNALD EIEKTNPKLK GILNRISQYQ LGNEVLTGLI 
NTFSDANFSN PEYNGEKLNL KSKDILGHVY EYFLGQFALA EGKQGGQYYT PKSIVTLIVE 
MLQPYNGRVY DPAMGSGGFF VSSDRFIEEH AGEKQYNAAE QKRNISVYGQ ESNPTTWKLA 
AMNMAIRGID FNFGSKNADT LLDDQHPDLR ADFVMANPPF NMKEWWNAKL ENDVRWKYGT 
PPQGNANFAW MQHMIHHLAP KGSMALLLAN GSMSSNTNNE GEIRRNLIKA DLVECMVALP 
GQLFTNTQIP ACIWFLTKDK SSGNGKAHRK GEVLFIDARK IGFMKDRVLR DFTREDIARI 
ADTFHKWQAD KEYEDEAGFC FSATLEDIQK NDFVLTPGRY VGAAEQAEDD EPFAEKMARL 
TAQLKGQLEE SAKLEAQIKA NLGGLGYEF