Gene Mpe_A0655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0655
Symbol
ID	4784782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	687489
End bp	688532
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	72%
IMG OID	640089214
Product	glycosy hydrolase family protein
Protein accession	YP_001019852
Protein GI	124265848
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.448002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.264846
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCACG CCCCCATCGT CCTCGACATC GCGGGGACCG CGCTCGATGC CAACGACCGG 
CGCCGCCTGC GTCACCCGCT GGTCGGCGGG CTGATCCTGT TCGCCCGCAA CTGGCAGCAC 
CGCGCCCAGC TGACCTCGCT CACCGCGGAG ATCAAGGCGC TGCGCCCCGA CGTGCTGGTG 
TGCGTCGACC ATGAAGGCGG GCGCGTGCAG CGCTTCCGCA GCGACGGCTT CACCCACCTG 
CCGCCGATGC GGGCGCTGGG CGAACGCTGG ATGCAGGATG CACTGGCCGC CACCGATGCC 
GCCACCGCCT GCGGCTACGT GCTGGCCGCC GAACTGCGTG CCTGTGGCGT CGATTTCAGC 
TTCGCGCCGG TGCTCGACCT CGACCACGGG CCGAGCGGCG TGATCGGCGA CCGTGCCTTC 
CACCGCGATC CGCGCGTGGC CACGCTGCTG GCCAAGAGCC TGATGCACGG CCTGCTGCTG 
GCCGGCATGG CGAGCTGCGG CAAGCATTTC CCGGGGCACG GCTACGTGGC CGCCGATTCG 
CACACCGAGG TACCGGTCGA TCGCCGCACG CTGCGCCAGA TCCTCGGCGA CGATGCCCGG 
CCCTACGAGT GGCTCTCCAC CTCGCTCCCC AGCGTGATGC CGGCGCACGT GATCTACCCG 
AAGGTCGATG CGCGGCCCGC CGGCTTCTCG CCGCGCTGGC TGCAGGACAT CCTGCGCGGC 
CGGCTCGGCT TCACCGGCGC GATCTTCAGC GACGACCTCA GTATGCAGGG CGCGACCGTC 
GCCGGCACGC CTACCGAGGC CGGCATCGCC GCGCTGAACG CCGGCTGCGA CCTGGTGCTG 
CTGTGCAACC AGTCTCTCGA CGGCGGCGCA CCGCTCGATG CGCTGATCGA CGGGTTGGAG 
ACGGCGCTCG AGCGTGGCCG CTGGCAGGCC AGCGCCGACA GCGAGGCGCG CCGCCTCGAC 
CTGCTGCCGC AGGCGGCGCC GTTGCCCTGG GACGAGCTGA TGCACCACGC GCCCTACCAG 
CGCGCGCTCG ACCAACTGCC CTGA

Protein sequence

MNHAPIVLDI AGTALDANDR RRLRHPLVGG LILFARNWQH RAQLTSLTAE IKALRPDVLV 
CVDHEGGRVQ RFRSDGFTHL PPMRALGERW MQDALAATDA ATACGYVLAA ELRACGVDFS 
FAPVLDLDHG PSGVIGDRAF HRDPRVATLL AKSLMHGLLL AGMASCGKHF PGHGYVAADS 
HTEVPVDRRT LRQILGDDAR PYEWLSTSLP SVMPAHVIYP KVDARPAGFS PRWLQDILRG 
RLGFTGAIFS DDLSMQGATV AGTPTEAGIA ALNAGCDLVL LCNQSLDGGA PLDALIDGLE 
TALERGRWQA SADSEARRLD LLPQAAPLPW DELMHHAPYQ RALDQLP