Gene Sare_2348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2348
Symbol
ID	5706932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2701238
End bp	2702704
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	68%
IMG OID	641271826
Product	major facilitator transporter
Protein accession	YP_001537197
Protein GI	159037944
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.720535
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.469317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCG AGAACCACAA CGGGGAGTTA CCTCGGACGG GGTCGGGTCG TCCGGTGCCG 
CGGGGACCGG TGGTGGTCGT AGGTGTGCTG GTGGCCTTCA TCATCGGGCT CAACATCGCC 
CTGTTGGTGA TCGTCTTGCC GACGATCCGG AGTACGCTCG GACTGGATTC GAGTAGTCAG 
CAATGGCTGA TCTCCGCGTT CTACCTCGCG TTCGGCCTGG TGTTGGTGCC GGCCGGTCGA 
TTCGGTGATG TACGCGGCCG GCGCGCCATC TTCGTGACCG GCGTGACGGC GTTCGTGGTG 
GCGAGCGGGG TCGCGGCCTT CGCCTCACAC GGGGCGTGGC TGATCGGCGC CCGGCTGGTG 
CAGGGTGTTG GCGTCGGGCT GGCGTTCGCG CAGGTCTTCG GAACGATACA GCGGCTGTAT 
TCCGCCCGGG AGCGGGGACT TCCGTTCGGA GCGGTCATCG CGGGCGTCAG CGTCGCCCGC 
GTGTCCGGTC CGGTGCTCGG CGGTGGACTG GTCGCCCTCG GCGGTGCCGA GTGGGGCTGG 
CGGTGGTCCT TTCTGGTCAA TGTGCCGGTG GGAATCGTCG TCGCGTTCCT CGGCTGGCGG 
TTGTTCCCGG TCGCGGAGCG AGTCGCGCGG CCGAGGATGG ACGTGACGGG GGCCGTCCTG 
TTGATGGTCG GGCTGGGCTT GGTGTGGCTG ACGCAGGGCG AGCAGTGGCC GGGGTGGGTT 
CGCTGGACAC TCCTGCCCGC GGGGTTGGTG CTGCTGGTCG GATTCGTGTT CTGGGAATAC 
CGGTACACCC GTCGGGGTGA GCCGATGTTC ACCATAAGAT TGTTCCGGTT TCGGTCGTTC 
GCGGCGGGGA TGGTCATCGC CACGTTCTAC ACCGCCGGCT ACGACGGCAT TTACTACCTG 
ATGTCGGAAT ACCTCCAACA TGGGCTCGGG CATAACGAAC TGGTGACCGG CATCGCGCTC 
ACCCCGCTGG CGCTGGGAGT AGCCGTCAGT TCGGTGATCG GTGGCGCCAA GGCGGGGCGG 
ATGGGCAGCC GGCTGGTTGT CTCGGGGCTG GTCCTCGTGG CGGTCGGGCT GACCGCGCTG 
CTGGTCGCCG ACCTCTTCCT TCCCGGCCCG GACTCCCCAC ACGCGGCCAC GCTGCCGCTA 
CTGCTGGCCG GACTGGGTGG CGGACTGGTC ACCTCAGGGG TGGGCGGTGG CCTGGTGAAC 
GCGCCGAACC TGACAGTGGC CCTGTCCCCC GTGCCACAGA CCGAGGGCGG AAGTGCTGGC 
GGGATGCTCG AGACCGGGCA GGCGTTCGGT GGCGGTCTGG GAGTTGGTGT CGTCGGCACG 
GTCATCTTCG CGAGTCTCGA CCAGACGGAC AACTGGTTGA CCGCCTTCCG GCTACCCGTT 
CTGGTCATCG TCGGACTCTT CGTCGTCGCG CTGGCAGCCG CCCTGATCAG CCTGTTCTTC 
CCGGACCGGG CCAGGCCACG GTCATGA

Protein sequence

MTAENHNGEL PRTGSGRPVP RGPVVVVGVL VAFIIGLNIA LLVIVLPTIR STLGLDSSSQ 
QWLISAFYLA FGLVLVPAGR FGDVRGRRAI FVTGVTAFVV ASGVAAFASH GAWLIGARLV 
QGVGVGLAFA QVFGTIQRLY SARERGLPFG AVIAGVSVAR VSGPVLGGGL VALGGAEWGW 
RWSFLVNVPV GIVVAFLGWR LFPVAERVAR PRMDVTGAVL LMVGLGLVWL TQGEQWPGWV 
RWTLLPAGLV LLVGFVFWEY RYTRRGEPMF TIRLFRFRSF AAGMVIATFY TAGYDGIYYL 
MSEYLQHGLG HNELVTGIAL TPLALGVAVS SVIGGAKAGR MGSRLVVSGL VLVAVGLTAL 
LVADLFLPGP DSPHAATLPL LLAGLGGGLV TSGVGGGLVN APNLTVALSP VPQTEGGSAG 
GMLETGQAFG GGLGVGVVGT VIFASLDQTD NWLTAFRLPV LVIVGLFVVA LAAALISLFF 
PDRARPRS