Gene Mpe_A0006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0006
Symbol
ID	4787255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	7643
End bp	8881
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	62%
IMG OID	640088553
Product	restriction modification system, type I
Protein accession	YP_001019203
Protein GI	124265199
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGCG ATTGCTACGT GGATGCCGGG GTTCGTGTTG TCCGCGGCAC CAACTTGACT 
GGCGGCCGAT CGTTCTCGGG TGAGTTTGTA TTCATCACGC CAGAGAAGGC TGTAGAACTC 
AATTCGGCGA ACCTGTCGCC GAATGACTTG GTCTTCCCTC ATCGTGGCGC TATTGGCGAA 
GTTGGCATCG TCCCGGAAGA CGGCGAGAGG TACGTTCTGT CCTCAAGCCT GATGAAGCTG 
ACATGCGATG TGGCCCGTGC ACACCCGGAC TTCGTCTACT ACTTTTTCAA GTCTGCGATT 
GGGCGCTTCG AACTTCTCAA GAACTCATCG CAGGTCGGCA CGCCGGGTAT TGGCCAGCCA 
CTGACATCAC TCAAACAAAT CAAGCTGAGG CTGCCGCCAG TCGGCGAGCA GGTAGCGATT 
GCGGCCGCTC TGCGTGCTCT CGACGACCGC ATCGCCCTCC TGCGCGACAC CAACGCCACC 
CTCGAAGCGA TCGCGCAGGC GCTGTTCAAG TCGTGGTTCG TCGACTTCGA TCCCGTTCGC 
GCCAAGAGCC AAGGCCTCGC CCCGGCCGGC ATGGACGAAG CCACGGCGGC CCTGTTTCCA 
GAGGGGGTCG AGGAGTCTGC TTTGGGGCCA GTGCCCAGGG GGTGGCGCGC TGCAACGTTG 
GCAGAAACCT TCGAGATCAA TCCCTCGCGC AGCCTTCCGA AGGATTCAGA GGCGAAGTAC 
CTCGAGATGG CCGGTGTGCC GACCACGGGC CATTGCGCCG AGTCGATCGC GGTGCGTGCC 
TTCGGGTCCG GCACCAAGTT TCGGAACGGC GACACGCTGC TGGCGCGCAT CACGCCCTGC 
CTCGAAAACG GCAAGACGGC GTTCGTCGAT TTCCTCGTGG AAGATGAGAT CGGCTGGGGA 
TCGACAGAGT TCATCGTGCT GCGGCCTAAG GCGCCGCTGC CCGATTACTT CGCCTATCTG 
CTGTGCAGAC ACGCACCGTT TCGCGAGTTT GCCGAGCGCA GCATGTCAGG GACGAGTGGA 
CGTCAGCGGG TGCAGAACGA TGTGCTCGCG ACCTATCGGA TTGCCGTGCC GCCATCAGCA 
GTTGCAGAAG CTTTCGGCGC GCTGATCAAT CCACTGCGGC ACGCGATCAC GAGCAACCAT 
GCGAGGGGAG CAACCCTTGG CGCGCTGCGT GATGCGCTGT TGCCTCGTCT GATCTCCGGC 
CAACTCCGCC TGCCTGACGC TGTGGCGCTG GCCGCCTGA

Protein sequence

MKSDCYVDAG VRVVRGTNLT GGRSFSGEFV FITPEKAVEL NSANLSPNDL VFPHRGAIGE 
VGIVPEDGER YVLSSSLMKL TCDVARAHPD FVYYFFKSAI GRFELLKNSS QVGTPGIGQP 
LTSLKQIKLR LPPVGEQVAI AAALRALDDR IALLRDTNAT LEAIAQALFK SWFVDFDPVR 
AKSQGLAPAG MDEATAALFP EGVEESALGP VPRGWRAATL AETFEINPSR SLPKDSEAKY 
LEMAGVPTTG HCAESIAVRA FGSGTKFRNG DTLLARITPC LENGKTAFVD FLVEDEIGWG 
STEFIVLRPK APLPDYFAYL LCRHAPFREF AERSMSGTSG RQRVQNDVLA TYRIAVPPSA 
VAEAFGALIN PLRHAITSNH ARGATLGALR DALLPRLISG QLRLPDAVAL AA