Gene Sare_2542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2542
Symbol
ID	5706864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2894724
End bp	2896169
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	71%
IMG OID	641272005
Product	major facilitator transporter
Protein accession	YP_001537375
Protein GI	159038122
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000721597
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGTTGAAC GCCCTGCCCC GGGCCCGGGG ACCGCCCCGC TCGATGCCGA TCGGGGCGGG 
CAACAACGCC GAGGGCCGGC GCTCGGCATC GGTCTGGTCG CCGTGTTCAT GACGCTGCTC 
GACGTGAGCA TCGTCAACGT CGCCATCCCG TCCATGGAGC GGGCGCTCGA CGTCGCCCCC 
AGCGATGTGC AGTGGGTGCT GTCCGGGTAC GCACTGACGT TCGGGCTGAT GCTGGTACCC 
GCCGGCCGTT TCGGCGACGG CCACGGACGG CGGACCGCGT TCGTCGTCGG AATCGTCCTG 
TTCACGATCA CCAGCGCCGG CGCAGGGCTG GCGCCGACCG CAACCTGGCT GGTCGCCGCC 
CGGCTACTGC AGGGAGCTGC CGCTGGCATA GTCAACCCCC AGGTCACCGG ACTGATCCAG 
GAGCTGTTCC GAGGTCCCGA GCGGGCCCGT CCGTTCGGGC TGCTCGGCGC GACCGTGGCC 
ATCTCCACCG CAGTCGGGCC GTTGCTCGGT GGCCTACTCA TCCACATCGG CGGCGAGGAG 
CACGGATGGC GGTGGGTCTT CTTCGTCAAC GTACCGATCG GTGTGCTCAC CGCCGTCCTC 
GGCTGGCGCC TGCTTCCCCG CCGCGCCCAC CGTGCCCGTG ACCGCCACCA GTTCGACCCG 
GTCGGGGTGC TACTGCTCGG CGCCGGCGTC CTGCTCGTGC TGCTGCCGCT GGTGCAGCAG 
CACTGGCAGG GTCCGACCAA GTGGCTGTTG CTGCCGGCCG GCCTACTGAC GCTGGCCGGC 
TTCGCCGGCT GGGAACGGTG GTACGCCCGC CGCCGCGAAC CGTTGTTCGA CCTACGCCTG 
CTCGGCATCC GTTCGTACCG GCTCGGCGTC GTGGTCGCCC TGCTGTACTT CGGCGGATTC 
ACCGCCATCT TCTTCGTTCT CACGGTGTAC CTGCAGAACG GCCTTGGGCA CAGCGCACTC 
GCCGCCGGGT TGGCCAGCAC ACCGTTCACG GTCGGCTTCG CCATCGCTTC CGTGGTGGGC 
GGGCGGGTCG TCAACCGCTT CGGTCGGCCA CTGGTCGCGG TCGGCCTGGC CACCGTCGTG 
GTCAGCCTCG TCGTCGTGGT CCTCGTCGTC AACCGGGTGC CCACCGGCGC GACGGTCTCC 
TGGTGGACCG CCACCCCGCT GTTCGTGGCC GGGCTCGGCA GCGGCCTGGT CATCACGCCG 
AACCAGGCCC TCACCCTCGC CCAGGTTCCG GTGCCGCGCG CCGGCGGCGG CGCCGGTTTG 
CTACAGACCG GCCAACGTAT CGGGTCCGCC GCCGGCATTG CCACGGTCGG CAGTGTCATC 
TTCTCCGCCC AGGGCGCCAC CGGTGACTGG TCGGTCGCCT TCCACCATGC GATGCTCCTG 
ACCAGCGGTG TCGTCGCCAT CGCGCTCTGC GTTGCGCTGA CCGACATCCT CATCGACCGC 
CGCTGA

Protein sequence

MVERPAPGPG TAPLDADRGG QQRRGPALGI GLVAVFMTLL DVSIVNVAIP SMERALDVAP 
SDVQWVLSGY ALTFGLMLVP AGRFGDGHGR RTAFVVGIVL FTITSAGAGL APTATWLVAA 
RLLQGAAAGI VNPQVTGLIQ ELFRGPERAR PFGLLGATVA ISTAVGPLLG GLLIHIGGEE 
HGWRWVFFVN VPIGVLTAVL GWRLLPRRAH RARDRHQFDP VGVLLLGAGV LLVLLPLVQQ 
HWQGPTKWLL LPAGLLTLAG FAGWERWYAR RREPLFDLRL LGIRSYRLGV VVALLYFGGF 
TAIFFVLTVY LQNGLGHSAL AAGLASTPFT VGFAIASVVG GRVVNRFGRP LVAVGLATVV 
VSLVVVVLVV NRVPTGATVS WWTATPLFVA GLGSGLVITP NQALTLAQVP VPRAGGGAGL 
LQTGQRIGSA AGIATVGSVI FSAQGATGDW SVAFHHAMLL TSGVVAIALC VALTDILIDR 
R