Gene EcE24377A_1272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1272
Symbol
ID	5586446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1279035
End bp	1280084
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	51%
IMG OID	640924970
Product	DNA methylase
Protein accession	YP_001462382
Protein GI	157156016
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.342929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAATA CTGTAAAAAT ATCCAGTTGT GAGTTAATCA ACGCTGATTG CCTGAAATTT 
ATCCAGACCT TACCGGAAAA CTCTGTCGAT CTGATAGTCA CAGACCCGCC ATACTTTAAA 
GTGAAGCCCG AGGGCTGGGA TAACCAGTGG GAGGGCGACG ATGATTACCT GAAATGGCTG 
GACCAGTGTC TGGCGCAGTT CTGGCGGGTA CTGAAGCCTG CCGGAAGTCT TTACCTGTTC 
TGTGGTCATC GCCTGGCATC TGACACCGAA ATCATGATGC GTGAGCGCTT TAATGTGCTG 
AACCACATTA TCTGGGCGAA GCCGTCCGGA CGCTGGAACG GGTGCAATAA GGAAAGTCTG 
CGGGCGTATT TTCCGGCAAC AGAGCGCATT CTGTTTGCAG AACATTATCA GGGACCGTAT 
CGCCCGAAAG ATGATGGCTA TGTGGCACAG GGGCGCGAGC TAAAACAGCA CGTCATGGCC 
CCGCTGATTT CTTACTTTCG TGATGCGCGT AAATCACTGG GAATAACGTC AAAACAGATA 
GCGGAAGCCA CCGGAAAGAA AAACATGGCT TCGCACTGGT TTGGTACCAG TCAGTGGCAG 
TTACCGAACG AGGGTGATTA CAACAAATTG CAGGCGTTGT TTGCGCGTGT TGCGGCAGAA 
AAACATCAGC GCGGGGAACT GGAAAAACCA CACCACCAGC TGGTCAGCAC ATACAGTGAG 
CTGAACCGGC AGTATACGGA ATTGCTGAGT GAATATAAAA ATTTGCGGCG GTATTTCGGT 
GTGACGGCGC AGGTTCCGTA CACCGATGTC TGGACGCATA AACCGGTGCA GTACTATCCA 
GGGAAACATC CGTGCGAAAA ACCGGCAGAA ATGCTGCAGC AGATAATCAA CGCGAGCAGT 
CGTCCGGGAG ACCTGGTTGC AGATTTTTTT ATGGGTTCAG GTTCAACGGT AAAAGCGGCG 
ATGGCACTGG GGCGTTGTGC GATTGGTGTT GAGCTGGAGA CAGGACGTTT TGAACAGACA 
GTCAGGGAAG TTCAGGATTT AATCGTTTGA

Protein sequence

MTNTVKISSC ELINADCLKF IQTLPENSVD LIVTDPPYFK VKPEGWDNQW EGDDDYLKWL 
DQCLAQFWRV LKPAGSLYLF CGHRLASDTE IMMRERFNVL NHIIWAKPSG RWNGCNKESL 
RAYFPATERI LFAEHYQGPY RPKDDGYVAQ GRELKQHVMA PLISYFRDAR KSLGITSKQI 
AEATGKKNMA SHWFGTSQWQ LPNEGDYNKL QALFARVAAE KHQRGELEKP HHQLVSTYSE 
LNRQYTELLS EYKNLRRYFG VTAQVPYTDV WTHKPVQYYP GKHPCEKPAE MLQQIINASS 
RPGDLVADFF MGSGSTVKAA MALGRCAIGV ELETGRFEQT VREVQDLIV