Gene Mpop_4051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpop_4051
Symbol
ID	6311887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium populi BJ001
Kingdom	Bacteria
Replicon accession	NC_010725
Strand	-
Start bp	4324918
End bp	4326198
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	642652750
Product	major facilitator superfamily MFS_1
Protein accession	YP_001926708
Protein GI	188583263
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGTCTG AGGTCCACAA CCGCCTCGTC GTCATCTCGG CCCTGGGCGT GGTGGAGATC 
CTCGCCTGGG GCTCGTCCTT CTACTTGCCG GCGGTGCTGG CGGGGCCCAT CGCCGCCGAC 
ACGGGTTGGC CGCTCGCATG GGTGGTCGGG GGGCTGTCCA TCGGCCTGCT GGTGGCGGCA 
ATCGCCTCGC CCCGGGTCGG AATCGCCATC CACCGGCACG GGGGTCGGCC GGTCCTTGTA 
TCGGCGGCCT TGCTGCTAGC GGGTGGCCAC TTGGTGATCG GACTGGCACC GAACCTTCCG 
GTGTTCCTGT CCGGCTGGCT GGTCATTGGG CTCGGGATGG GCTGCGGCCT CTACGACCCG 
GCCTTCGCCA CCCTCGGCCG GCTCTACGGC GACGAGGCGC GCCCGGCCAT CACCACCCTG 
ACCCTATGGG GTGGGTTCGC CAGCACCGTC TGCTGGCCGC TCTCGGCCCT TCTCGTCGAG 
CAGGTCGGCT GGCGCTCGAC ATGTCTTGCC TATGCCGGGC TGCACCTCTT CGTCACGCTT 
CCCCTGGTGC TCGGTCTGAT CCCTGAGGCG CCTGCCTTGG CTAACGGCGG GGACGTAAAA 
CACCTTGGCG AAGCGCCGCT CACCTCGCGG GAACGGCGCG CCTTCGCGCT GATGGCCGGC 
GTGTTGGTTT TCGGCGGCAC CGTGATGACG TTGATCTCGG TCCACCTGAT TACCTTGCTG 
CAGGCACGCG GCGTGGCCTT TGCCGCCGCC GTATCCTACG GCGCCCTGAT CGGGCCGTCC 
CAGGTCGGAG CCCGCGTTAT CGAGATGGCC AATAAGGGGC GGCACCACCC GCTCTGGACG 
CTAAACGTGG CCATGGCCCT CGTGGCGCTC GGGCTGGCAA TCCTGGCAGT GGGCATTCCT 
GCGGTCGGCA TCGCCTTGGT GCTCTACGGT GCCGGCAACG GGATCTACTC GATCGCGAGA 
GGCACGGTGC CGCTCGCCCT GTTCGGGTCG GAACGCTACC CGGTTCTGGC GGGGCGGCTC 
GCCCGGCCGA GCCTGATCGC CCAGGCTCTT GCTCCGTCGC TGGGGGCCAC GGTCCTCACC 
TACGGCGGCC CCGATTTGGC CTATGCCCTT CTGGCGGTGC TCGCGCTCGC GAACGTCGGT 
TTGGCAGGCG CCTTGTGGGG CACACGACCG GAAGCGGTCG GCATCCCCGG CGAGGCCGAG 
GCGGGCTCGA AGAACAGGTG CTTCGCTTCA GCAGCCAAGC CGAAGGGCCG CCTTCGAAAC 
GGCCCCCCTT CTTCGCTCTA G

Protein sequence

MRSEVHNRLV VISALGVVEI LAWGSSFYLP AVLAGPIAAD TGWPLAWVVG GLSIGLLVAA 
IASPRVGIAI HRHGGRPVLV SAALLLAGGH LVIGLAPNLP VFLSGWLVIG LGMGCGLYDP 
AFATLGRLYG DEARPAITTL TLWGGFASTV CWPLSALLVE QVGWRSTCLA YAGLHLFVTL 
PLVLGLIPEA PALANGGDVK HLGEAPLTSR ERRAFALMAG VLVFGGTVMT LISVHLITLL 
QARGVAFAAA VSYGALIGPS QVGARVIEMA NKGRHHPLWT LNVAMALVAL GLAILAVGIP 
AVGIALVLYG AGNGIYSIAR GTVPLALFGS ERYPVLAGRL ARPSLIAQAL APSLGATVLT 
YGGPDLAYAL LAVLALANVG LAGALWGTRP EAVGIPGEAE AGSKNRCFAS AAKPKGRLRN 
GPPSSL