Gene EcE24377A_3323 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3323
Symbol
ID	5589709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3336291
End bp	3337919
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	42%
IMG OID	640926959
Product	DNA methylase
Protein accession	YP_001464330
Protein GI	157155781
COG category	[L] Replication, recombination and repair
COG ID	[COG2189] Adenine specific DNA methylase Mod
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.622136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACGA AGCAAAAATT AGAACTTAAC TGGATTGGTA AGCATAAGCG TCCTCGTCTG 
GAGCCGCGTA TTCTGCTCGA AGATAAGGAG TTATCTTATG GTGATGCGGA TAGTGAGAAT 
CTGCTGATTC ATGGGGATAA TCTACTGGCG TTGAAGGCAC TGGAGCAGAA GTATGCGGGG 
AAGGTGAAGT GTATATTTAT CGACCCTCCT TATAATACTG GAAGTGCTTT TACACATTAC 
GATGATGGAC TTGAACACTC TCTATGGCTT TGCTTGATCA GAGATCGGTT AGAATTATTA 
CGCACTTTAT TATCTGAAGA TGGCTCTATA TGGATAACAA TTGATGACCA CGAAGTTCAT 
TATTTAAAAT GTCTTTGTGA TGAAATATTC GGAAGGAATA ACTTTATTTC AAATGTTATT 
TGGGAAAAAT CCGATAGCCC AAGAATGGAT GCTGCATTTT TCTCTTCTCG CCATGATCAC 
ATATTAGTGT ACGCGAAAGA TCAGTCAAAA TTCAAAGTAA AAAGACAACC ACTGTCCCTC 
AATGATCTAC CTAGCCATTA CGATAAAGTA GATCCAAGCG GCAATCCTTA CTACCTAAAA 
CCGCTAAGGG CAATGGGACA AGCAGATAAA AGAGAAGATC GCCCAACAAT GTATTTCCCT 
CTTGTTGCCC CCGATGGCAC AGAAATTTTT CCAAAGCGCC AAGATGGAAC TGATGGACGT 
TGGCGTTGGG GCGTACAAAA AATAGATCAG GAGAAATGGA GAATTGATTG GTCGAAAGGA 
CGAAATGGTT GGACTCCATA TTTTCGTGTA TATGCTGATA GTTCGTCAGG TAGACCGCCA 
GAAACGATAT GGTTTCATTC TGAAGTTGGA AGTAACAGGA CATCAAAAGC CGAAATTAAG 
AAGGTGATTC CTACTATAAG TGCATTTGAT ACACCTAAGC CGGAAGCTCT TATAAAAAAA 
ATACTGGAGA TTGCAACTGA CAATGGTGAT CTTGTTCTAG ACTCCTTTGC TGGTTCAGGC 
ACAACAGGGG CCGTAGCACA AAAGATGGGG CGTCAGTGGA TTATGGTTGA ATTAGGCGAC 
CACTGTCGGA CTCATATTGT TCCGCGTATG AAAAAAGTGA TTGATGGGAA AGATTTAGGC 
GGTATTACAA AATCTGTAAG CTGGCAAGGT GGTGGAGGTT TTCGTTATTT GAGTCTAGCA 
CCTTCATTGC TTAAAAAAGA TACTTGGGGT AATTGGGTAA TAAATAAATA TTACAATCCT 
GAAATGCTTG CTGAAGCCAT GTGCAAACAT ATGAACTTCA CCTATGCACC AAGCCAGACT 
CAATACTGGA ATCACGGTTA CAGCACCGAA ACTGACCACA TCTACGTCAC TACCGGTTCT 
TTGGCTTATG AACAACTGAA AGTTCTGAGT GAAGAGGTAG GAACTGAACG TACATTACTG 
ATTTGCTGCA AAGCCTTTAT GACTGAAGGC GCGGACTTCC CTAACCTGAC GCTGGTAAAA 
ATTCCGCGTG CCATTTTGAG CAAATGCGAA TGGGATCAGG ACGACTATAG CTTTACGCTA 
AACGTTCTCT CTGATTCAGA ACAGCCTGAC GATATTGACT ACGACGAAGA CACCGAAGAC 
GAAGAATAA

Protein sequence

MSTKQKLELN WIGKHKRPRL EPRILLEDKE LSYGDADSEN LLIHGDNLLA LKALEQKYAG 
KVKCIFIDPP YNTGSAFTHY DDGLEHSLWL CLIRDRLELL RTLLSEDGSI WITIDDHEVH 
YLKCLCDEIF GRNNFISNVI WEKSDSPRMD AAFFSSRHDH ILVYAKDQSK FKVKRQPLSL 
NDLPSHYDKV DPSGNPYYLK PLRAMGQADK REDRPTMYFP LVAPDGTEIF PKRQDGTDGR 
WRWGVQKIDQ EKWRIDWSKG RNGWTPYFRV YADSSSGRPP ETIWFHSEVG SNRTSKAEIK 
KVIPTISAFD TPKPEALIKK ILEIATDNGD LVLDSFAGSG TTGAVAQKMG RQWIMVELGD 
HCRTHIVPRM KKVIDGKDLG GITKSVSWQG GGGFRYLSLA PSLLKKDTWG NWVINKYYNP 
EMLAEAMCKH MNFTYAPSQT QYWNHGYSTE TDHIYVTTGS LAYEQLKVLS EEVGTERTLL 
ICCKAFMTEG ADFPNLTLVK IPRAILSKCE WDQDDYSFTL NVLSDSEQPD DIDYDEDTED 
EE