Gene Mpe_A0603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0603
Symbol
ID	4785704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	634708
End bp	635802
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	74%
IMG OID	640089162
Product	putative glycosyl transferase
Protein accession	YP_001019800
Protein GI	124265796
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.447417
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGCA TCCTTTTCTT CGCCGACGCG AGCAACCTGC ACACGCAGCG CTGGGTGCGC 
GAGATCGCCG ACCGCGGCTT CGACTGCGTG GTGCTCACGC GCCGTCCGGC CGAGGTGCCG 
GGCGCCAGCG ACGTGATCGC GGTGCGCCCC GGCAGCGACG GCGCCGGCTG GTTCCTCGCG 
CTGCCCGAGG TGCAGCGCAT GGCTCGCCGG CTCTCGCCGC AGTGGTTGCA CGGCCACTAC 
GTCACGTCCT ACGGCCTGTG GGCGGCGGCC TGCTCGCTGG GCGCACAGGT GCCGCGGGTG 
CTGACGGCCT GGGGCTCCGA CATCCTGGTC ACGCCGCGCG CCCCGGGGCT GCGCGGCGGT 
GCGATGGCGG CGCTGGTGGG CTGGTCGCTC CGGCGCGCGC GGCTCATCAC CGCCGACTCG 
CAGGACATGC TGACCGAGAT CCGCCGCTAC GGCGTGACGG GGCGCTGCGA AGAGGTGCTG 
TGGGGCGCCG ACACCGACCG CTTCCGCCCC GGCAAGCCGG CCGCCGACTT CGAGATCGCC 
AGCCTGCGCA ACTGGGAGGC CAACTACAAC ATCGACACCG TGCTGCGCGC CTTCGCGCGG 
CTGCGCGCGG TGCGTCCGCA GGCCAACGCC ACGCTGCACC TGCTCGGCGG CGGGCCCGAC 
GAGGCGGCCC TGAAGGCGCT GGCCGCCGAG CTGGCGCTGC CGGCGGAATC GGTCCGCTTC 
CTGGGGCGGG TGGGCGAGGC GACCCTGATC ACGACGCTGC AGCGTTCGCG CGTGTCGCTG 
AGCGTGCCGA GCAGTGACGC CACCTCGGTC TCGCTGCTGG AGTCGATGGC CTGCGGCCTG 
CCGGTGGTGG CGAGCGACCT GCCCTCCAAC CGGCAGTGGA TAAGCGGCGA CGCCGACCTG 
CTGGTGCCGG CGCGCGACGC GAGCGCGCTC GCCGCGGTCC TGCTGCGGCT CCACGACGAG 
CCGGAGTTCG CGCGTGGCGA GGGCCTGCAC AACCGCGCGC TGGCGGTGGA GCGCGCCTCG 
CGCCGGGTGC AGATGGACCG CATGGCGACG CTCTACGAAT CGCTGCGCCC GCGGGTGGCG 
GTACCCGTCG CGTGA

Protein sequence

MNRILFFADA SNLHTQRWVR EIADRGFDCV VLTRRPAEVP GASDVIAVRP GSDGAGWFLA 
LPEVQRMARR LSPQWLHGHY VTSYGLWAAA CSLGAQVPRV LTAWGSDILV TPRAPGLRGG 
AMAALVGWSL RRARLITADS QDMLTEIRRY GVTGRCEEVL WGADTDRFRP GKPAADFEIA 
SLRNWEANYN IDTVLRAFAR LRAVRPQANA TLHLLGGGPD EAALKALAAE LALPAESVRF 
LGRVGEATLI TTLQRSRVSL SVPSSDATSV SLLESMACGL PVVASDLPSN RQWISGDADL 
LVPARDASAL AAVLLRLHDE PEFARGEGLH NRALAVERAS RRVQMDRMAT LYESLRPRVA 
VPVA