Gene Sare_0506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0506
Symbol
ID	5705524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	575961
End bp	577241
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	641270032
Product	major facilitator transporter
Protein accession	YP_001535426
Protein GI	159036173
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.204304
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00963798
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCAGGCGA AGCTGAGCAC GATGTTCCAG TCCCTACAGG TCCGCAACTA CCGTCTGTTC 
GCCTCCGGGC AGCTGATCAA GCTGATCGGT GTCTGGATGA TGTTCATCGC CCAGGACTGG 
CTCGTCCTCG AACTCAGCGA CAACTCCGCC ACCGCGCTCG GCATCGTCAC CGCCCTCCAG 
TTTGCTCCCG TCCTGCTGCT CACCCTGATT TCCGGGCGGC TCGCGGACCG GTACGACAAG 
CGCGTCCTGC TCTTTGCCGC CAACCTGTTC TGGACGGTGC TCTCGCTGGC CATGAGCCTG 
TTGGTGATCA CTGGCCTGGT GCAGCTGTGG CATGTCTTCG CCTTCGCCGC CCTCCTCGGC 
GTCGCCAACG CCGTGGAAAC CCCGGTGCGG CAGGCGTTCG TCTCCGAACT GGTGGGCACC 
CCACTACTGG CCAACGCGCT CTCGCTCAAC GCGGCCACCT TCAACTCCGC GCGAATCGTC 
GGCCCAGCCC TCGCCGGGCT GGCCATCGCC GCCGTGGACG TGGGGCCGGT CTTCCTGGTC 
ACCGCCGTCA GCTCGATCGC GCCGCTGGTG AACGTGATCC GGATCCGTAC GGGCGAACTA 
CACCGCGAGA CGCTGCCCCC GCGCGAGGAG CGGTCGTCAG CCCGAGTCAT CGACGGGTTG 
CGTTACGTCC GGGCCCGCCC GGACCTGTTG CTGCCGATGT TCCTCATCTC GATCATCGCC 
ACCTCACTGT TCAACTTCCA GCTCACCCTC GCCGCATTGG CCAAGACCGT CTTCAACACT 
GGTGCCGCGT CGTTCGGCCT GTTCAGCAGC GCCCTCGCGG TGGGCGCCCT GGCCGGGGCC 
TTGGCCGGCA CCGGACGACG CAGCCGCCCC TCGGTGTGGC TGGTGCTGTC CGCGGCCATC 
GCCTGCGCCA TCCTCGGCAC GCTGGTCGGG CTCGCTCCCA CGTACTGGCT GGTGGTGCTC 
CTGCTGCTGC CGACCGGGTT CGCCACCGTG TTCTTCGCCC AGGCGTGCAA CCAGCGCATC 
CAACTGGGCA CCGACGCTGC CTTCCGGGGT CGGGTGATGG CGTTGTGGGT GCTGGTGTTC 
CTCGGCACCA ATCCAGTCGG CGCGCCGATC ATCGGTTGGG TCGCCGAGAC GTACGGCGCC 
GGGGCCAGCA TTTGGATGGG CGGGCTGATC TCCCTCGCCG CCGCGCTGCT CGCCCTGGCC 
TGGCAGCTGC GCCGGTCGGG AGCGCGGCTG CGGTTCCAGG TGCTGCCGAT GCCCCGTTTC 
TACGTCACCG AGCGGATGTA A

Protein sequence

MQAKLSTMFQ SLQVRNYRLF ASGQLIKLIG VWMMFIAQDW LVLELSDNSA TALGIVTALQ 
FAPVLLLTLI SGRLADRYDK RVLLFAANLF WTVLSLAMSL LVITGLVQLW HVFAFAALLG 
VANAVETPVR QAFVSELVGT PLLANALSLN AATFNSARIV GPALAGLAIA AVDVGPVFLV 
TAVSSIAPLV NVIRIRTGEL HRETLPPREE RSSARVIDGL RYVRARPDLL LPMFLISIIA 
TSLFNFQLTL AALAKTVFNT GAASFGLFSS ALAVGALAGA LAGTGRRSRP SVWLVLSAAI 
ACAILGTLVG LAPTYWLVVL LLLPTGFATV FFAQACNQRI QLGTDAAFRG RVMALWVLVF 
LGTNPVGAPI IGWVAETYGA GASIWMGGLI SLAAALLALA WQLRRSGARL RFQVLPMPRF 
YVTERM