Gene Mpe_A0726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0726
Symbol
ID	4784972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	753014
End bp	754063
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	640089287
Product	putative glycosyltransferase protein
Protein accession	YP_001019923
Protein GI	124265919
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCCT CCTTGCCGAA GATCAGCGTG GTGATCCCAT GCTTCAACTA CGCCCGCTAC 
GTGGGGCAGG CCATCGAGAG CGCGCTGGCG CAGGCGCATC CCGATACGGA GGTGGTGGTC 
GTCAACGACG GCTCCACCGA CGGCTCGCTG GCGGTGATCG AGCGCTACGC GCAGCGGGTG 
GTGGTGATCG ACCAGGTGAA CCAGGGCTCC ATCGCCGCCT ACAACCGCGG CTTCTCGGAA 
TCGAGCGGCG ACGTGGTGAT CTTCCTCGAC GCCGACGACC TGCTGGAGCC CGGCGCGCTG 
GCCGCCGTGG CGGCGGCCTG GACGCCGGCC TGCGCCAAGC TGCAGTACGA CCTGAAGATC 
ATCGACGCCG AAGGCCGCGA CACCGGCCGC CGCTTCTGCA ACTTCGCCAA CGGCTACGGC 
ACGGCCGAGG CCCGCAGCGC CTTCCTGCGC ACCGGCACCT ACCGCTGGCC CGTGACGACC 
GGAAACGCCT ACTCGCGCTG GTTTCTCGAA CCGATGTTTC CGCTGCGCAT CGAGCACGGC 
CCCGATGGCC ACCTGAACAC CGTGGCACCG GTGTACGGCG ACGTGAAGGT GCTGCCGCAG 
GTGCTGGGCG CCTACCGGGT GCACGGCGCC AACATGTGGT CCAGCGACGG CTCCGACCAT 
TCGCGCCTGC CCTTCCGCAT CCACACCCGC CAGCGCGAAG TGGCCTTCAT GCAACTGCAC 
GCGCAGCAGC GCGGTGTGTT CCTGCCGGCC GGCAACGTGC TGGATCGGGA ACTGCCTTTC 
CTCAACTACC GGCTCATGGC GCTGAAGCTC GGCCTGGCCT ACACCGGCCA GGAGCACGAC 
TCGCCCTGGT CGCTGGTGCG GCGGGCTTGG TCGCTCATCG TGTCGGAGCC CATGTCGCTC 
AAGCACCGCG TGGGCCACCT CGGATGGTTC GGCGTGCTGG CGCTCGCACC GCGGCAGGCG 
GTGCCGGCGC TCTTGCACGT GCGCTTCAAC CGCAGCGAAC TGCTTCAGTC GCTGCGGCGC 
TCCGTGGGGC TGGCGCCCGT GCGCACCTGA

Protein sequence

MTPSLPKISV VIPCFNYARY VGQAIESALA QAHPDTEVVV VNDGSTDGSL AVIERYAQRV 
VVIDQVNQGS IAAYNRGFSE SSGDVVIFLD ADDLLEPGAL AAVAAAWTPA CAKLQYDLKI 
IDAEGRDTGR RFCNFANGYG TAEARSAFLR TGTYRWPVTT GNAYSRWFLE PMFPLRIEHG 
PDGHLNTVAP VYGDVKVLPQ VLGAYRVHGA NMWSSDGSDH SRLPFRIHTR QREVAFMQLH 
AQQRGVFLPA GNVLDRELPF LNYRLMALKL GLAYTGQEHD SPWSLVRRAW SLIVSEPMSL 
KHRVGHLGWF GVLALAPRQA VPALLHVRFN RSELLQSLRR SVGLAPVRT