Gene Mpe_B0340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_B0340
Symbol
ID	4787968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008826
Strand	+
Start bp	287830
End bp	289251
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	64%
IMG OID	640092772
Product	C-5 cytosine-specific DNA methylase
Protein accession	YP_001023350
Protein GI	124262880
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCAC TGCATACCTA CGCAGTACGC AAGATTGGCA GCCACCGTGG TTCGCCACGG 
CTCTGGCTGG AGGGCAGGGA GCCGACCAAG GGAGGTTTCC TGCCGGGCAC GCGCTTCAAC 
ACGCGTGTCG ACACCGGCCG GGCACTCCTG GTGCTGGAGG CGGTCGAAGA TGGTGTTCGC 
ATCGTCTCTG GCAAGCAGCG CGGCGACCGG CAGATCCCGG TCATCGACAT CAACAGCAAG 
GAACTGCTCG ACATCTTCAC GGGTATCGAG GCGGTCCGCG TGATCGTCCA GGAGGGTGTC 
ATCAGCATCC TGCCGCTGGC CTCCGAACTG CGCGCGCGCG AGCGCGTCAT TCGGCTGAAG 
GACGGACTGG CGAACGGAAC CCTTTCCACC GGCTCGGTTT CGAGCGGCAT CGGGGTGCTT 
GACCGTGCGG CGCACGAGGG CCTTGAACAG GCCGGCGTGG AGTGCCGCCT GGCCTTCGCG 
AACGAGATCC GGGAAGACTG CGTCGAGCAC ATGTGCGATC ACAACCCGAT CGTGGACCAG 
CACACCGTGA CCCTGACGGC GCCGATGCAG GAGCTCGCGT TCGACGAGTG GGCGATGAGC 
CGCTTGCCGA AGGTGGACGT TCTGGTCGGC GGCATCCCTT GTTCCGGCGC AAGCAGGGCA 
GGGCGCGCGA AGCGGGGCGC CTCGCACGCG GAAGCGCACC CCGAAGTCGG TCACCTGATC 
GTGGCCTTCC TCGCCATCAT CGCCAAGGTG AACCCGTCGG CCATCGTGCT GGAGAACGTC 
CCCGTCTGGG GAACCTCTGC TTCGATGTTC ATCCTGCGCA ACCAGCTGCG GGACCTGGGA 
TACGACGTCC ACGAGACGAT CGTCAACTCG GCCGAATGGA ACGTGCTCGA GCACCGGGAG 
CGCCTGTGTG TCGTGGCGGT GACCAAGGGG ATCGAGTTCA GCTTCGACGG CCTAGAGCGG 
CCGGAGCCCG TGAGTCGCCG TCTCGGCGAG ATCATGGACG AAGTGCCGGT GGACGCGCCG 
TGCTGGAGCG AGATGGCCTA CCTGAAGGAC AAGCGTGCCC GCGACGAGGC CAAAGGCAAC 
AACTTCAAGA TGACGGTGCT CACGCCCGAC AGCGAGAAGG TGCCTTGCCT GAACAAGTCC 
TTGTGGAAGC GCCAGAGTTC TGGCAGTTTC TGGAAGCATC CGGACGACAG CAACCTTCTG 
AGGCTGCCCA CAGTGCGTGA ACACGCGCGC TGCAAGGGTG TCTGGGAGGA TCTGGTCGAA 
GGTGTCGGCC TGACCTTCGG GCACGAGGCT CTCGGACAAT CCGTCACGGT TCCGCCGTTC 
ATCTCGATCT TCAAGCTGCT CGGCCAGGCG CTCAAACGCT TTGCCAGTGA GGCTGAGGCT 
TCGATCCAAC CCTTCGCGCT CCGCGAGCTC AAGGCAGCCT GA

Protein sequence

MTSLHTYAVR KIGSHRGSPR LWLEGREPTK GGFLPGTRFN TRVDTGRALL VLEAVEDGVR 
IVSGKQRGDR QIPVIDINSK ELLDIFTGIE AVRVIVQEGV ISILPLASEL RARERVIRLK 
DGLANGTLST GSVSSGIGVL DRAAHEGLEQ AGVECRLAFA NEIREDCVEH MCDHNPIVDQ 
HTVTLTAPMQ ELAFDEWAMS RLPKVDVLVG GIPCSGASRA GRAKRGASHA EAHPEVGHLI 
VAFLAIIAKV NPSAIVLENV PVWGTSASMF ILRNQLRDLG YDVHETIVNS AEWNVLEHRE 
RLCVVAVTKG IEFSFDGLER PEPVSRRLGE IMDEVPVDAP CWSEMAYLKD KRARDEAKGN 
NFKMTVLTPD SEKVPCLNKS LWKRQSSGSF WKHPDDSNLL RLPTVREHAR CKGVWEDLVE 
GVGLTFGHEA LGQSVTVPPF ISIFKLLGQA LKRFASEAEA SIQPFALREL KAA