Gene Sare_3971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3971
Symbol
ID	5705248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4509692
End bp	4511119
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	69%
IMG OID	641273396
Product	major facilitator transporter
Protein accession	YP_001538752
Protein GI	159039499
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0239086
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTGG CCACCGGCAG TCCGGTACGG GCGTGGGTCG GTGGCCCTTC GCACCGGCTC 
TACAGCGTCG TGGTGTTCGT GCTGCTGGCC TCCCTGGACA ACGTGGCGAT CGGCCTGGTG 
CCCCCGCTGT ACGGTTCGAT CGCTGCCGCC CTCGACGTAC CGCAGCGCCT GCTTGGCCTG 
GTCACCGCGG CCAATTTCCT GGTCAGCGCG GTGGCCGCGG TGGGCTGGGC GTACGTCGGG 
GACCGCACCA ACCGTAAGCC GCTGCTCATG GTCGGCACGT TGATCTGGGC CTTCGGCACC 
GGCGGCAGCG CGGTGGCGGG AAGCTATCCG ACCTTCCTGA CCGCCCAACT CGTCGGTGCG 
GTCGGGCTCG GTGCGGTCGG CTCGGTCGGC TTCTCGGTGG TCACCGATCT GATCTCACCT 
CGCCGGCGAG GACTGGTGAT GAGCTTCTGG GGGCTGTCAC AGGGCGTCGG TACGCTGGCC 
GGAACCCTGG TGGGTGGCCT GCTTGGGGCG GCGGACTGGC GACGCCCGTT CCTGACGCTC 
ACCGTCGTGG GCCTCGGCGC CACCGCGGCG TACCTGTTCA CCTATGACAT CCAGCGTGGG 
CAGAGCGAAC CGGAGTTGGC CGACCGGTTG GCCGGTGGGG CCGAGTACGA CCACCGGATC 
AGCCGGGCCG ACCTGCCGCG GATTCTCGGC CGACGGACGA ACCGTTGGCT GATCCTGCAA 
GGGCTCACCG CGCAGGCCGC GTTCGGCTCG CTGGTGTGGT TGCCGGTGCT CTTCACTGAA 
CGGGCCGAGG CCCAGGGTTA CTCGGCCGCC ACGGCGGTTG TGGTGGGCAG CGTCTTCGCC 
ACCCTGTTCC AGTTGGGCGG TGTCTTCTCC ATTGTTGGGG GGCTGGTCGG TGATGCCCTG 
CAACGCCGTA CCCCGTCCGG CCGGGCGTTG GTCGCCGCGG TCGGGATCCT CGCGGCGCTC 
CCGTTCTATC TGGTGCTCTT CTTCGTTCCG ATCCGCATCG ACGTGCCGGA CGGAGCCGGC 
TCGGGTGCCA TTGTCCGAGC CGTGCTGGCG AGTGTCCTGA CCGAGCCGAC GGTCGGACTG 
AGCCTGCTCG CAGCATTGCT GGCACTCGCC CTGACCTCTG CCAATTCGCC GAACTGGTTC 
GCGTTGATCG CCGATGTCAA CCCGCCCGAG CACCGGGGCA CCGTGTACAG CCTCGGCAAC 
CTGGTCAACG GGGTCGGCCG GGCCGCCGGC AACGGGCTGG TCGGGGTGGC GTTCCACGGG 
CTGCGGGCGG CCTTCCCGCC GCCGTTGAAC TACGCGGTCG GGCTCGCCGC CTTCCAGCTG 
TTCTTCGTAC CGACCGGGAT CATGTACTGG CTCGCCGCCC GTAGCTCCCC GCGCGACATC 
GCCGCTGTGC GCGTCCTGTT GCGCATCCGC GCCAAGCGAA TGTCGTAG

Protein sequence

MTLATGSPVR AWVGGPSHRL YSVVVFVLLA SLDNVAIGLV PPLYGSIAAA LDVPQRLLGL 
VTAANFLVSA VAAVGWAYVG DRTNRKPLLM VGTLIWAFGT GGSAVAGSYP TFLTAQLVGA 
VGLGAVGSVG FSVVTDLISP RRRGLVMSFW GLSQGVGTLA GTLVGGLLGA ADWRRPFLTL 
TVVGLGATAA YLFTYDIQRG QSEPELADRL AGGAEYDHRI SRADLPRILG RRTNRWLILQ 
GLTAQAAFGS LVWLPVLFTE RAEAQGYSAA TAVVVGSVFA TLFQLGGVFS IVGGLVGDAL 
QRRTPSGRAL VAAVGILAAL PFYLVLFFVP IRIDVPDGAG SGAIVRAVLA SVLTEPTVGL 
SLLAALLALA LTSANSPNWF ALIADVNPPE HRGTVYSLGN LVNGVGRAAG NGLVGVAFHG 
LRAAFPPPLN YAVGLAAFQL FFVPTGIMYW LAARSSPRDI AAVRVLLRIR AKRMS