Gene Msil_1814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1814
Symbol
ID	7094093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1974344
End bp	1975912
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	63%
IMG OID	643465141
Product	major facilitator superfamily MFS_1
Protein accession	YP_002362121
Protein GI	217977974
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0912576
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCA TCGCGGTTTC GCCCGCCGCC GCGCCGCATA GCGAGGCTGG CTCCCTGCGG 
CCCTATATCG GCATCCTTGG CGTCCTACTC GGCGCGATGA TGAGCACGCT CGGAAGCCGG 
GTCACGACGT TCGGCCTCGC CGATCTTCGC GGCGGGCTGC ATGCCGGCTT CGACGAAGGC 
GCCTGGATCA CGACGAGCTT TGGCGTCGGG CAGATGGTCA GCGGCGTCGC CAGCGCCTAT 
CTCGCCTCGA TCTTCGGCGT GCGGCGCTTT CTGCTTTATG GCGTCACGCT GTTCTTCACG 
ACCTCGCTGC TGGCGCCTTT TTCGCCCAAT CTGACGGCCT ATTTCGTCAC GCAATTTCTC 
GGCGGGCTCG GGTCCGGGAC GTTCATTCCG CTGACCATCA GCTTCATCGT CCGCAGCCTG 
CCGCAGCGGC TGATCATCTA TGGCGTCGCC GTCTATGCGA TGAATTCCGA ACTGTCGCAG 
AATATCGGCG CTTCGCTCGA GGGCTGGTAC GCGGAGAACT GGTCCTGGGG CTTTATCCAT 
TGGCAATATT GCCTTGCCTT GCCGCTGATG TTCGTCTGCG TTGTTTACGG CGTGCCGCGC 
GATCCGCCGA CGTCGACGCG CCTGCGCGAT CTCGACTGGC CGGGCCTCGT CTATGGCGCC 
TCCGGCTTCG CCTTGCTCTA CGCCGGCCTC GATCAGGGCA ATCGGCTCGA CTGGACAAAC 
AATGGCCTCG TCAACGGGCT TCTCATCGCC GGCGCGCTGT TCAGCTGCCT CTTTATCGTC 
CGCGAATATG TCGCCGAGCG GCCCTTCATC AATCTGCGGG TCATCGCGCG CGAAAGCCTT 
GCTCCGCTGA TCCTGCTGCT CGCCGGCTAT CGCTTCATCA TCCTGTCGAC CGCCTATATC 
ATTCCGAGCT ATCTGCAGAC GGTGCAGAAT TTCCGCGAGC TGCAGGTCGG CTCCGTGCTG 
TTGTGGATCG CTCTGCCGCA ATTCGTCATC GTGGTTCCGC TCGCCGCGCT TCTAAAGCGG 
GTCGACCCGC GTCTCGTGCT TGGCCTCGGG ACGGGCTTTA TCGGCGTCGC GTGCCTGATG 
GCGACCGGCC TGACCAGCCA ATGGGCGACG CAAGATTTCC TCCCCTCGCA GGTTTTGCAG 
GCGATCGGCC AATCCTTCGC GCTGACCGCG CTGCTTGTTC TGATCGTCCG ATCGATCAAG 
CCGGCCGATG CGCTGACGAT CGGCAGTCTG ATGCAGATTA CGCGGCTGCT TGGCGGAGAG 
ATCGGCACCG CTTTCATGCA GACTTTTGTC CGGATCCGGG AGCAGGTGCA TTCCAATCTC 
GTCGGACTGC ATGTCGAAAG TCTCTCCGCG CTGACCGCCG CGCGGCTCGA CGCCTATCGC 
AGCATTCTTG CGGGCAGCTC CTCCGAGGCC GAGGCGGCCG CGCGCGCGGC CAAATTGCTC 
GGCCAGCATG TCGCGCAGCA GGCGGCGGTG CTGTCCTACA TCGACGGTTT TGTCGCCGCC 
GCTTTCGGCA GCTTTCTCTG TCTGCTTGTG GTCGCCACGG TCAAATATCG CCCGCCGGCG 
CTCTGCTGA

Protein sequence

MSVIAVSPAA APHSEAGSLR PYIGILGVLL GAMMSTLGSR VTTFGLADLR GGLHAGFDEG 
AWITTSFGVG QMVSGVASAY LASIFGVRRF LLYGVTLFFT TSLLAPFSPN LTAYFVTQFL 
GGLGSGTFIP LTISFIVRSL PQRLIIYGVA VYAMNSELSQ NIGASLEGWY AENWSWGFIH 
WQYCLALPLM FVCVVYGVPR DPPTSTRLRD LDWPGLVYGA SGFALLYAGL DQGNRLDWTN 
NGLVNGLLIA GALFSCLFIV REYVAERPFI NLRVIARESL APLILLLAGY RFIILSTAYI 
IPSYLQTVQN FRELQVGSVL LWIALPQFVI VVPLAALLKR VDPRLVLGLG TGFIGVACLM 
ATGLTSQWAT QDFLPSQVLQ AIGQSFALTA LLVLIVRSIK PADALTIGSL MQITRLLGGE 
IGTAFMQTFV RIREQVHSNL VGLHVESLSA LTAARLDAYR SILAGSSSEA EAAARAAKLL 
GQHVAQQAAV LSYIDGFVAA AFGSFLCLLV VATVKYRPPA LC