Gene Msil_0857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0857
Symbol
ID	7093290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	946195
End bp	947406
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	63%
IMG OID	643464195
Product	major facilitator superfamily MFS_1
Protein accession	YP_002361189
Protein GI	217977042
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATCG CTGCGCGCTC TCACGCGAAG ATCGAAGCGC GCCGTGCGCG CGTTGGCGCC 
GCTGCTTGGC GCTCCATTCT CGTCGCGTTG ACCGCCTTTC TGACTGTCGT CGACCTGTTC 
GCGACACAGG CTATCTTGCC GCCGCTGGCT CATGCCTACG CTGTGACTCC GGCCGCGATG 
GGCCTCGCCG TCAATGCGAG CACTTTCGGC ATGGCCGCTG CGAGCTTTGC GGTCGCCGCG 
TTCAGCCACC GGATCGATCG CCGTCGCGGC GTGATCATGA GTCTCGTCGC ATTGTCGGTC 
CCGACGCTGC TGCTCGCCAT AGCGCCCAAT CTTGCCGTGT TTGCCCTGTT GCGAATCATG 
CAAGGATTGC TGATGGCCTC CGCCTTCACG CTGACGCTCG CCTATTTGAG CGAGCGATGC 
AGCGCATCGG ATACTGCAAG CGCCTTCGCC GCCTATATCG CAGGCAATGT CGCGTCCAAT 
TTATTCGGTC GCCTTCTCGC CGCAGCGACG ACGGATCATT TCGGGTTGGC CACGAATTTT 
GTGCTGTTTG CCTGCCTCAA TCTCGCAGGC ACCGCGCTTG TCTATTTCAC GGTTCGACGC 
CAATCCGCGC CGCCCCAGGA CTACGCGCCG ACGGATCCAG CTTCGGCCAT AAGGGGGCAT 
CTGAACAACC CGGCGCTGCG CGCCAGCTTT GGCGTCGGCT TTTGCATTCT CTTCGCCTTC 
ATCGGCGTTT TCACTTTTGT GAATTTTGTC CTCGTTCGTC CCCCGATCAG CGCGGGCATG 
ATGACTGTCG GATTCGTCTA TCTCGTCTTT CTGCCCTCGA TCGCGACAAC CTTGTGGGCG 
GGGCGGGCTG TCGCGCGGTT AGGGCAGAGG CGCGGCCTTA TCGGCGGGCT CGTCGTCGCG 
GCAGCTGGAT TGCCGTTCCT GCTGACGTCG TCTCTCATGC TCGTGACCGC GGGTCTCGGC 
TTTTTCGCGA TTGGAACATT CTTCGCGCAG GCGGTGGCGA CGGGATTCGT CGGCCCCGCA 
GCGACGGGCG ACCGAGGCGC CGCGAGCGGC CTCTACCTTG CATGCTACTT TCTCGGCGGG 
ATCGCCGGCA CGGCGACGCT TGGCTGGATA TTCGACAGTT TCGGCTGGGC CGCCTGCATC 
GGCGGCGTCG CGTTTTCGCT GAGCGTCGCG GCGCTGCTCG GGACGCGGTT TTTCCTGCCC 
GCGCATCACT GA

Protein sequence

MSIAARSHAK IEARRARVGA AAWRSILVAL TAFLTVVDLF ATQAILPPLA HAYAVTPAAM 
GLAVNASTFG MAAASFAVAA FSHRIDRRRG VIMSLVALSV PTLLLAIAPN LAVFALLRIM 
QGLLMASAFT LTLAYLSERC SASDTASAFA AYIAGNVASN LFGRLLAAAT TDHFGLATNF 
VLFACLNLAG TALVYFTVRR QSAPPQDYAP TDPASAIRGH LNNPALRASF GVGFCILFAF 
IGVFTFVNFV LVRPPISAGM MTVGFVYLVF LPSIATTLWA GRAVARLGQR RGLIGGLVVA 
AAGLPFLLTS SLMLVTAGLG FFAIGTFFAQ AVATGFVGPA ATGDRGAASG LYLACYFLGG 
IAGTATLGWI FDSFGWAACI GGVAFSLSVA ALLGTRFFLP AHH