Gene Mpe_A0995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0995
Symbol
ID	4787171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1056335
End bp	1057585
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	72%
IMG OID	640089557
Product	putative membrane transport protein
Protein accession	YP_001020192
Protein GI	124266188
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTG CCGCGCCGCC GTCTCCTTCT TCTTCCTCCT CCTCGCCGCC GCTGCCGCGT 
GGAGCGGTCG CCTGCCTGGC GCTGGCGGCC TTCGGCAGCG GCTTGTCGAT GCGGGTGAAC 
GATGCCCTGC TGCCGCGCCT GGCCGGCGAG TTCGCCCTCA CGCTGGGCCA GGCTTCGCAG 
GTCATCGGGC TGTTTGCGAC GGCCTACGGG CTGGCCCAGC TGTTCTTCGG TCCGGTCGGC 
GATCGCTACG GCAAGTACCG CGTCATCGCC TGGGCCACCG CGGCCTGCGC CCTCACGTCG 
GTGCTGTGCG GGATGGCACC CGGCTTCGAT GCGCTGCGTC TGGCGCGCGT GCTGGCCGGA 
GCCACCGCGG CGGCGGTGAT CCCCTTGTCG ATGGCGTGGA TCGGCGACGT CGTCGACTAC 
GAGCGCCGGC AGCCCGTCCT TGCGCGCTTC CTGATCGGCC AGATCTGTGG CCTGTCCGCC 
GGCGTCTGGT TGGGAGGCTT CGCGGCCGAT CACCTCGGCT GGCGCGCGCC TTATTTCCTG 
CTCGCGGGCT TCTTCGCGCT GGTGAGCGTC GCGCTGTTCG CGCTGAACCG GCGTCTGCCG 
GACGCCGCCC GCCCGGTGCG CGCGGCGAGT GACGGGTCGC CGTTGCGCCG CATCGCGACC 
GAGTTCGGCG GCGTGCTGGC GCGTCCCTGG GCTCGGGTGG TCCTCGGTCT GGTGTTTCTC 
GAGGGCCTGT TCCTGTTCGG GCCGTTCGCC TTCATCGCCT CGCACGTGCA CGAGGCCTTC 
CAGCTCTCGC TGTCGGCCGC GGGCGCGCTG GTGATGCTGT TCGGGCTGGG CGGCTTCGCC 
TTCGCCGTTT CGTCCGGCCC CCTGGTGCGG CGGCTCGGCG AGGCCGGCCT GGCACGTTGG 
GGCTCGCTGA TGATGTGCGG GGCGCTTGTC GCGGTCGGCT TCGGGCCGGG CTGGGGCTGG 
GCGCTGGCCG GATGTTTCGT CGCCGGACTG GGCTTCTACA TGGTGCACAA CACGCTGCAG 
GTGAATGCCA CGCAGATGGC GCCCGACCGG CGTGGTGCGG CCGTCGCCGC CTTCGCCTCG 
TGCTTCTTCC TCGGGCAGTC GGCCGGCGTG GCGCTGGGCG GGTGGCTGGT GGGGGTGATC 
GGTCCGCCGG GCTTCCTGGC GATCGGCGCG GTGGGTCTGC TGCTCATCGG ACGGGCCTTC 
GTGGCCGGTC TCGCGCTGCG GTCGCGGGCC GCGGCAGCCG TTGCCGTGTA G

Protein sequence

MNAAAPPSPS SSSSSPPLPR GAVACLALAA FGSGLSMRVN DALLPRLAGE FALTLGQASQ 
VIGLFATAYG LAQLFFGPVG DRYGKYRVIA WATAACALTS VLCGMAPGFD ALRLARVLAG 
ATAAAVIPLS MAWIGDVVDY ERRQPVLARF LIGQICGLSA GVWLGGFAAD HLGWRAPYFL 
LAGFFALVSV ALFALNRRLP DAARPVRAAS DGSPLRRIAT EFGGVLARPW ARVVLGLVFL 
EGLFLFGPFA FIASHVHEAF QLSLSAAGAL VMLFGLGGFA FAVSSGPLVR RLGEAGLARW 
GSLMMCGALV AVGFGPGWGW ALAGCFVAGL GFYMVHNTLQ VNATQMAPDR RGAAVAAFAS 
CFFLGQSAGV ALGGWLVGVI GPPGFLAIGA VGLLLIGRAF VAGLALRSRA AAAVAV