Gene Sare_0984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0984
Symbol
ID	5707524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1109153
End bp	1110367
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	74%
IMG OID	641270499
Product	major facilitator transporter
Protein accession	YP_001535886
Protein GI	159036633
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.973774
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00222704
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAACCTGA AGCCTTACCG GGCGGCGCTC GCCCTGCCCG GTCTCCGAAC TCTGCTGATC 
GTGGCGGTCC TCGCCCGTAT CCCGCTCACC GCGACCGGGC TGACCCTCAC GTTCTACGTC 
GTCCAGGACC TCGGCCGAGG GTACGGAGCC GCCGGGCTGG TCGGCGCCGC GATCACCGTC 
GGCGCGGCCG TCGGCGGCCC GGTGCTGGGC CGCCTGATCG ACCGGCGCGG CCTTCGCCCG 
GTGCTGGTGT TGACCGCCGT GGCCGAGGCG ATCTTCTGGT CGACCGCGCC GATGCTGCCG 
TACCCACTGC TGCTGCCGGC CGCGTTCCTC GCCGGTTCGC TGGCGCTGCC GATCTTCTCG 
GTGATCCGCA GTTCCATCGC GGCAATCGTG CCGGCGGACC GCCGCCGAGC CGCGTACGCG 
CTGGACTCGG TGTCGGTGGA ACTGGCCTTC ATGATGGGTC CGGCCCTGGC CACCGTCGCG 
GTCACCACCA TCTCCGCGCG CACCACGCTC TACCTGGTGG GGGCCGGCAT CGTCGCCGCC 
GGCGTCGGGC TCTTCCTGCT CGACCCGCCA CTTCGGGGTG CCAGCGACCC GGTAGGCCCG 
CAGCGTAAGG TGCCGCGGCG GGAGTGGCTC ACCCCCCGGA TGGTCGCCGT ACTGGCCGTC 
AGCACCGCCG CCACCGTGGT GCTGGGCGGC ACCGACGTGG CGGTGATCGC GGTGCTGCGC 
GACAACGGCG ACATCGGGTT CACCGGCGTG GTGCTGGCCA TCTGGGCCGT CGCCTCGCTG 
GTCGGTGGCT TCGCCTACGG GGCGGCCACC CGGGCCCCGT CCCCGTTGGC GTTGCTGGCG 
GTCCTGAGCA TCGCCACGAT CCCGGTCGGA CTGGCCGGCG CGAACTGGTG GCTGCTCGGC 
CTGGTACTGA TCCCAGCCGG CCTGCTCTGC GCCCCGACTC TCGCCGCCAC CTCGGACGCG 
ATCAGCCGGT TGGCACCCGT GGACGCGCGC GGCGAGGCGA TGGGCCTGCA CGGCTCCGCC 
ATCACCGTCG GCATCGCGGT CGGCGCCCCA CTGGCCGGTG CCGTCATCGA CGCGTCGGCA 
CCGGCCTGGG GCTTCGCCGT GACCGGCGCG GTGGGTGGCC TGGTCGCCCT GGTGGTGCTT 
CCGATAGAGC TGCGCCGCCG CAGGGCTGGG GCACCGGCGC CCGTTCCCGA GCCCGAGCTG 
ACCCACGCCG CCTAG

Protein sequence

MNLKPYRAAL ALPGLRTLLI VAVLARIPLT ATGLTLTFYV VQDLGRGYGA AGLVGAAITV 
GAAVGGPVLG RLIDRRGLRP VLVLTAVAEA IFWSTAPMLP YPLLLPAAFL AGSLALPIFS 
VIRSSIAAIV PADRRRAAYA LDSVSVELAF MMGPALATVA VTTISARTTL YLVGAGIVAA 
GVGLFLLDPP LRGASDPVGP QRKVPRREWL TPRMVAVLAV STAATVVLGG TDVAVIAVLR 
DNGDIGFTGV VLAIWAVASL VGGFAYGAAT RAPSPLALLA VLSIATIPVG LAGANWWLLG 
LVLIPAGLLC APTLAATSDA ISRLAPVDAR GEAMGLHGSA ITVGIAVGAP LAGAVIDASA 
PAWGFAVTGA VGGLVALVVL PIELRRRRAG APAPVPEPEL THAA