Gene Mpe_A3350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3350
Symbol
ID	4786391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3559957
End bp	3561633
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	66%
IMG OID	640091923
Product	putative sugar transport protein
Protein accession	YP_001022538
Protein GI	124268534
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCTG TTCTACCCAC CTCCGGCGCC GCTGCGGCGC GCCCGATGAC CGCGGAGGAG 
AAGAAGGTCA TCTTCGCGTC CTCGCTCGGG ACCGTGTTCG AGTGGTACGA CTTCTACCTG 
TACGGATCGC TGGCGGCCAT CATCGCCAAG CAGTTCTTCG CGGGGCTGGA TGCCGGCTCG 
GCCTTCATCT TCGCGCTGCT GGCGTTCGCC GCCGGCTTCA TCGTGCGACC GTTCGGCGCG 
ATCTTCTTCG GCCGTCTGGG CGACATGATC GGCCGCAAGT ACACCTTCCT GGTCACGATC 
CTGATCATGG GTCTGTCGAC CTTCATCGTC GGCATCCTGC CCAACTACGC CGCGATCGGC 
GTGGCCGCGC CGGTCATCCT GATCGGCCTG CGCCTGCTGC AGGGCCTGGC GCTCGGCGGT 
GAGTACGGCG GTGCCGCCAC CTACGTGGCC GAGCACGCTC CGCACGGCAA GCGCGGCGCC 
TACACCTCGT GGATCCAGAC CACCGCGACG CTGGGCCTGT TCCTGTCGCT GATGGTCATC 
CTGGGGACCC GCACGCTGGT CGGCGAAGCG GCGTTCGCCG ACTGGGGCTG GCGCGTGCCT 
TTCCTGGTCT CGATCTTCCT GCTCGCGATC AGCGTGTGGA TCCGCCTGAG CATGAACGAA 
TCGCCCGCCT TCAAGAAGAT GAAGGAGGAG GGCAAGACCT CCAAGGCGCC GCTGACCGAG 
TCGTTCGGCC AGTGGAAGAA CCTGAAGATC GTGATCCTGG CGCTGATCGG CCTGACCGCC 
GGCCAGGCCG TGGTCTGGTA CACCGGTCAG TTCTACGCGC TGTTCTTCCT GACGCAGTCG 
CTGAAGGTCG ACGGTGCCAC CGCGAACATC ATGATCGCGA TCTCGCTGCT GATCGGCACG 
CCGTTCTTCA TCGTCTTCGG CTCGCTGTCG GACAAGATCG GCCGCAAGCC CATCATCCTG 
GCCGGCTGCC TGATCGCCGC GCTGACCTTC TTCCCGCTGT TCAAGGCGCT CACCGAGGCG 
GCCAACCCCG ACCTCGCCGC CGCGCAGGCG AAGAACAAGG TGCTGGTGCA CGCCGACCCG 
GCCGAGTGCT CGTTCCAGTT CAACCCGACC GGCACCGTCA AGTTCACCAG CTCGTGCGAC 
ATCGCCAAGC AGGTCCTGGC CGCCGGCTCG GTGAGCTACG ACAACGTGGC GCATGCCGCC 
GGCACGCCCG CCACCATCAC CATCGGCGAG ACGGTCATCC AGAGCTACAG CTCCAAGGGC 
CTCCCGCCCG ACGAGGCGAA GGCGAAGGAC GCCGAGTTCA AGAAGTCGGT CGCCGAGACC 
CTGAAGGCCG CCGGCTACCC CGCCAAGGCC GATCCGGCGA AGATGAACAA GCCGCTGATC 
GTCGGCATCC TGGTGATCCT GGTGATCTAC GTCACCATGG TGTACGGGCC GATCGCCGCG 
ATGCTGGTCG AGATGTTCCC GACCCGCATC CGCTACACCT CGATGAGCCT GCCGTACCAT 
ATCGGCAACG GCTGGTTCGG CGGCCTGCTG CCCACCACCG CCTTCGCGAT CGTGGCCCAG 
ACCGGCAACA TGTACAACGG CCTCTGGTAC CCGATCATCA TCGCCGGCAT CACCTTCGTC 
GTGGGTCTGA TCTTCGTCCG CGAGACCAAG GACGTCGACA TCTACGCCAA GGACTGA

Protein sequence

MAAVLPTSGA AAARPMTAEE KKVIFASSLG TVFEWYDFYL YGSLAAIIAK QFFAGLDAGS 
AFIFALLAFA AGFIVRPFGA IFFGRLGDMI GRKYTFLVTI LIMGLSTFIV GILPNYAAIG 
VAAPVILIGL RLLQGLALGG EYGGAATYVA EHAPHGKRGA YTSWIQTTAT LGLFLSLMVI 
LGTRTLVGEA AFADWGWRVP FLVSIFLLAI SVWIRLSMNE SPAFKKMKEE GKTSKAPLTE 
SFGQWKNLKI VILALIGLTA GQAVVWYTGQ FYALFFLTQS LKVDGATANI MIAISLLIGT 
PFFIVFGSLS DKIGRKPIIL AGCLIAALTF FPLFKALTEA ANPDLAAAQA KNKVLVHADP 
AECSFQFNPT GTVKFTSSCD IAKQVLAAGS VSYDNVAHAA GTPATITIGE TVIQSYSSKG 
LPPDEAKAKD AEFKKSVAET LKAAGYPAKA DPAKMNKPLI VGILVILVIY VTMVYGPIAA 
MLVEMFPTRI RYTSMSLPYH IGNGWFGGLL PTTAFAIVAQ TGNMYNGLWY PIIIAGITFV 
VGLIFVRETK DVDIYAKD