Gene Mpe_A0610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0610
Symbol
ID	4785177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	642664
End bp	643941
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	70%
IMG OID	640089169
Product	putative capsule polysaccharide export protein
Protein accession	YP_001019807
Protein GI	124265803
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3562] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.251819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTCG CCTATCTCGA CCCTCCTTAC AGCCGCTACT TCCACGAGCT GGCGGCGCGG 
TTGGCTCGGC CTTCGGGCGG CAGTGTCGTC GCCCTGCTGT CCTGTCCGGC CTATCGCCTG 
TACGCGGGGG GCGACCGCGC GCAGGTCTGG GAGCCGGGTG CGCCGGCGCA GGCGCACGAC 
GTGCCACCGG CCTTCGAGCG GGCGGGCTGG GCGCAGACCG ACTCGCCGGA ATTCCGGCGC 
GCCTTCTCGC ACGCCGTGGA GTGGTTCAAG GAGCGTTTCA CCGCTGAACA CACCGACGTC 
TGCCTGGTGT TCTCCGATGC CCGGCCGTTC TCGCAGGCGG CGCACCTGGC GGCGCAGCAG 
CTGGGCGTCG TCTGCGTGTT CTTCGAGCGC GGCGCCTTCC GCTACCGCAC CGCGAGCCTG 
AGCACGCAGG GGCTCAATGC GCGCTTCTGC CTGCAGCAGG CGCAGCAATC GCCCCTGCTC 
GAGGCGCTCC CGCTCTTCGA TCTGCCGCCG CGCCGGGCGA TCGAGCCCTG GTTGAAGCTG 
CGTTTCGTGG GCTTCATGGC GCTCAACGGC CTGCTCGGCG CGCTGCAGCC GCAGCGCCGG 
CCGATGCAGC ACAAGAGCTA CCACTTCTTC AACTACCTGC GCATCGCCCT CAAGCAGTTC 
GGCGCCGAGC ATCCCGAACT GCCGCTCGCG CAGGCCCCGG AACCGCCGGC CACCGACGGG 
CCGGTGGTGG TGCTGCCGCT GCAGCTGCCG ACGGATTCGC AGTTCGTCAT GTACTCGCCG 
TTCCGGCACA ACCAGGAACT GATCGATTTC GTGGCCCGTC AGATGCGGAA CGCGCTGCCC 
GGGACCCCGC TGCTGGTGAA GAAGCACCCG ATGGATGTGC GCAGCTACCG GCTGCCGGCC 
GGCGCGCGCT GGATCGACGG CAGCCTGGCG CGCTTCAACG AGCGTCCCGC GGTGTTCGTC 
TGCCTCAATT CGAACGTGGG CTTCGAGGCG GCGATCCATG GCAAGCCGGT GCTGTGCTTC 
GCCGACAGCT TCTACACCGG CCACCCGAGC GTGACGCGGG TGAGCCGCGA GGACTTCGCA 
CCACAGCTCG CGGCCGCGGC GGCGCGGCCC GATGACCTGG CGGCGGGCAG GGCACTGCGC 
GCGGCCGTGC TGCGGCATTG CCAGGCGCCG GGCGACGTGT GGGCCTACAG CGCCGAAGAC 
TTGGCACTGA CGCGGGACAT CGTGGCGACG CACTACGATG CGGCCCGGCT GTCGTCCGGG 
GCTGCGCCGC CTGCCTGA

Protein sequence

MNVAYLDPPY SRYFHELAAR LARPSGGSVV ALLSCPAYRL YAGGDRAQVW EPGAPAQAHD 
VPPAFERAGW AQTDSPEFRR AFSHAVEWFK ERFTAEHTDV CLVFSDARPF SQAAHLAAQQ 
LGVVCVFFER GAFRYRTASL STQGLNARFC LQQAQQSPLL EALPLFDLPP RRAIEPWLKL 
RFVGFMALNG LLGALQPQRR PMQHKSYHFF NYLRIALKQF GAEHPELPLA QAPEPPATDG 
PVVVLPLQLP TDSQFVMYSP FRHNQELIDF VARQMRNALP GTPLLVKKHP MDVRSYRLPA 
GARWIDGSLA RFNERPAVFV CLNSNVGFEA AIHGKPVLCF ADSFYTGHPS VTRVSREDFA 
PQLAAAAARP DDLAAGRALR AAVLRHCQAP GDVWAYSAED LALTRDIVAT HYDAARLSSG 
AAPPA