Gene Mpe_A1556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1556
Symbol
ID	4785606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1678683
End bp	1679951
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	71%
IMG OID	640090124
Product	putative transmembrane transport protein
Protein accession	YP_001020753
Protein GI	124266749
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.233072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATTC CAGTTCCCGC TTCTTCGCCT GCCGCCGGCG CCACGCTGCG CCAGGACGCC 
CGCACCATCG GCCTGGTCGG CCTGGCGCAC GGCACCTCGC ACTTCTTCCA CATGCTGTTG 
CCGCCGCTGT TCCCGGCCTT CATCCGCGAC TTCGGCCTCA GCTACTCCGA GCTCGGGCTG 
CTGGTCACCA TCTTCTTCGT GGTGTCGGGC ATCGGCCAGG CGCTGGCCGG CTTCCTGGTC 
GACCGCGTGG GCGCGCGGCC GGTGCTGTTC CTGGCCCTGG GGCTGTTCGT CGCTTCGGCG 
CTCATGGCAG CCACGGCCCA TGGCTATGTC GGCCTGATGC TGGCCTCGGC GCTGGCCGGG 
CTTGGCAATT CGCCCTTCCA CCCGGTCGAC TTCACGATCC TGAACAAGCG CGTCTCGCCG 
CCGCGCCTGG GTCACGCCTT CTCGGTCCAC GGCATCACCG GCAACCTGGG CTGGGCCGCC 
GGACCTGTGT TCATGGCCGG GCTGACTGCC GCCACCGGCT CCTGGCGCAT CGCCGCCGCG 
GCGGCAGGCG GTGTGGCGCT GCTGGTGCTG GTGGTGCAGG TGCTGAACCG CGAGGCGATC 
GACGACCGCG CCAGCAACTG GGCCCACGAG TCCAAGGCCG GCATCACGGA TCTGCCCGAA 
GAGCACCCGA TGGCCTTCCT GAAGCTGCCC TCGGTATGGC TGTGCTTCGC CTTCTTCTTC 
TGGACCACGG CGGCACTCAC GGCGATCCAG AGCTTCGCCA GCCCGGCGCT GCAGCAGATG 
TACGGCCTGC CGCTGACCGT GACCGCCTTC GTCGTGACCG GCTACATGCT GTGCGGCGCA 
GCCGGCATGG TGATCGGCGG CTTCCTGGTC ACGCGCATCC AGCGTCTGGA GCGCACCATC 
GGCTACGCGA TGGCGGCATC GGCCGGCCTG CTGCTGCTCA CCGGCACCGG CTGGTTGCCG 
GGCCTCGCTG CGGCGGCGGC AGCCTCGCTG GCCGGTTTCG GGACCGGGCT CGCCGGGCCG 
TCGCGCGACA TGCTGATCAA GCGCGCCGCG CCGCCGGGGG CCACCGGCCG TGTCTACGGC 
ACCGTGTACT CGGGCCTGGA CATCGGGTTC GCGCTCGCCG CGCCGCTGTT CGGCGCCTTG 
CTCGACCACG GGCAGCCGAA CAGCGTGTTC CACGGCGCGG CGCTGATGAT GTTGCTGGGC 
GTGATGTCGG CCTCGATGGT CGGTCTGCGC ATCGCGCGCG GCCGCGCCGT GCCGGTGCTC 
GCGACCTGA

Protein sequence

MQIPVPASSP AAGATLRQDA RTIGLVGLAH GTSHFFHMLL PPLFPAFIRD FGLSYSELGL 
LVTIFFVVSG IGQALAGFLV DRVGARPVLF LALGLFVASA LMAATAHGYV GLMLASALAG 
LGNSPFHPVD FTILNKRVSP PRLGHAFSVH GITGNLGWAA GPVFMAGLTA ATGSWRIAAA 
AAGGVALLVL VVQVLNREAI DDRASNWAHE SKAGITDLPE EHPMAFLKLP SVWLCFAFFF 
WTTAALTAIQ SFASPALQQM YGLPLTVTAF VVTGYMLCGA AGMVIGGFLV TRIQRLERTI 
GYAMAASAGL LLLTGTGWLP GLAAAAAASL AGFGTGLAGP SRDMLIKRAA PPGATGRVYG 
TVYSGLDIGF ALAAPLFGAL LDHGQPNSVF HGAALMMLLG VMSASMVGLR IARGRAVPVL 
AT