Gene EcE24377A_2909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2909
Symbol
ID	5586861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	2912713
End bp	2914260
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	46%
IMG OID	640926562
Product	N4/N6-methyltransferase family protein
Protein accession	YP_001463944
Protein GI	157159201
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID	[TIGR00497] type I restriction system adenine methylase (hsdM)

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGAA AACCTAAAGA AATCAAAACA GATCCGTTAG AAGTCATCCT GTGGAAAGCG 
GCAGACAAGC TGCGTAAAAA CATTGATGCA GCCGAGTATA AGCATGTCGT GCTGGGCCTC 
ATTTTCCTTA AGTATATTTC TGATTCTTTT GAATCTCATT ATGAGTTGCT GAAGGCAGGT 
GAAGGCGAGT TCGCAGGCGC TGACCCGGAA GATAAAGACG AGTACACCGC TTACAACATT 
TTCTTTGTCC CTGAGCTTGC ACGCTGGAAC TATCTAATAT CTAAGGCCAA GCTACCTGAA 
ATCGGTAAGC TGGTTGATGA TGCTATGGAG CTTATCGAAG CGGGTAACCC ACAGCTAAAA 
GGTGTGCTGC CGAAAGTCTA CGCTCGCCAG AACCTCGACG CCACCGTGCT GGGTGAACTG 
ATAGATTTGA TTGGCAACAT TGCACTGGGA GATGCCAAAG CGCGTTCTGC TGATGTATTA 
GGCCACGTAT TCGAATACTT CCTTGGTGAA TTTGCACTGG CAGAAGGTAA ACAGGGCGGT 
CAGTTCTATA CGCCAAAATC CATCGTAAGC CTGCTGGTTA ACATGCTGGA ACCCTATAAA 
GGCCGAGTCT TTGACCCCTG CTGTGGTTCT GGTGGTATGT TCGTTCAGTC AGAAAAATTT 
GTAGAAGCAC ATCAGGGAAA TATTGACGAT ATTTCGATCT ATGGGCAGGA GTCCAACCAG 
ACCACCTGGC GTCTGGCAAA AATGAACCTG GCAATTCGTG GGATTAATTC TGAACACGTT 
CGCTGGAATA ATGAAGGTTC ATTTCTTAAC GATGCTCACA AAGATTTGAA ATCTGATTTT 
ATCATAGCTA ACCCACCGTT TAACGTTTCC GACTGGTCTG GTGAGCAGCT TCGTGGTGAT 
GCCCGCTGGC AATATGGCAT TCCACCTGCT GGCAACGCTA ACTTTGCCTG GATGCAACAC 
TTCCTGTATC ACCTGTCGCC AAAAGGTCAG GCTGGCGTTG TGCTGGCAAA AGGGGCTTTA 
ACCTCTAAAA GTTCGGGTGA AGGTGATATT CGTGCAGCAC TGGTCAAAGA TGCCAATGTG 
ATTGATTGTA TCGTTAACTT ACCCGCAAAA CTGTTCCTGA ATACCCAGAT CCCAGCGGCC 
TTATGGTTTA TGCGCCGAGA TCGTGAAAAC AGCAGTCATT ATCGTGATCG CAGTAAAGAA 
ATTCTGTTTA TTGATGCCCG TAATCTTGGT CATTTAATCA ACCGCCGTAG CAAAGTGCTT 
TCTGACGAAG ATATCAAAAC TATTGCTGAC ACCTACCATA ACTGGCGTAA CAAAGGTGGC 
GACTACGAAG ATGTGGCTGG TTTCTGTGCA TCTGTCGATA TCAATGAAGT CGCTAAACTT 
GATTATGTGC TGACGCCTGG CCGTTATGTT GGCCTTGCTG ACGAAGAAGA CGATTTTGAC 
TTTAAAGAAC GTTTTACGGC TCTTAAAGCG GAGTTTGAAG CACAATTGGA AGAAGAAGCG 
CATCTGAATA AGTCTATCGC TGAGAGTCTG GCGAAGGTGG TTTTATGA

Protein sequence

MARKPKEIKT DPLEVILWKA ADKLRKNIDA AEYKHVVLGL IFLKYISDSF ESHYELLKAG 
EGEFAGADPE DKDEYTAYNI FFVPELARWN YLISKAKLPE IGKLVDDAME LIEAGNPQLK 
GVLPKVYARQ NLDATVLGEL IDLIGNIALG DAKARSADVL GHVFEYFLGE FALAEGKQGG 
QFYTPKSIVS LLVNMLEPYK GRVFDPCCGS GGMFVQSEKF VEAHQGNIDD ISIYGQESNQ 
TTWRLAKMNL AIRGINSEHV RWNNEGSFLN DAHKDLKSDF IIANPPFNVS DWSGEQLRGD 
ARWQYGIPPA GNANFAWMQH FLYHLSPKGQ AGVVLAKGAL TSKSSGEGDI RAALVKDANV 
IDCIVNLPAK LFLNTQIPAA LWFMRRDREN SSHYRDRSKE ILFIDARNLG HLINRRSKVL 
SDEDIKTIAD TYHNWRNKGG DYEDVAGFCA SVDINEVAKL DYVLTPGRYV GLADEEDDFD 
FKERFTALKA EFEAQLEEEA HLNKSIAESL AKVVL