Gene Sare_2558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2558
Symbol
ID	5708424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2913245
End bp	2914489
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	75%
IMG OID	641272021
Product	major facilitator transporter
Protein accession	YP_001537391
Protein GI	159038138
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.653406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000197888
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCTCCG ACACGACCCC ACTGCGAGGT GGCCCGCACC CGGGCCCGAT CGCCTCGCCC 
GACCGGCGGG CCCGGTCACT CGCGGCAGCC CTCTACGGGT ACGCGTTCCT GCGCGACCTC 
GTCCTGCTCT ACCCCGTCTA CCCGCTGCTG TTCACCGACA CCGGTCTGAC GGTGTGGCAG 
ATCTCGACCT TGTTCGTCAT CTGGTCGGCC AGTTCGATCG TGCTGGAGGT CCCCTCCGGG 
GCGTTGGCCG ACGCCGTCTC CCGGCGGCTG CTGCTCTGCC TCGCGCCGCT GGTGACCGCC 
GCCGGCTTCG CGCTCTGGAC ACTCGTGCCC TCGTACCCGG CCTTCGCGGT GGGCTTCCTG 
CTCTGGGGAG TCGGCGGCGC GCTCGCCTCC GGTGCGTTGG AGGCCCTGGT CTACACCGGC 
CTGGAGCGGC TCGGCGCGGC CAGCCGGTAC GCCCGTGTCA TCGGCCGGGC CCGCACCGCG 
GAAACCCTCG GCGTGTTGGC CTCCCTCGTG TTGGCGGCGC CGGTACTCGC CCTCGGCGGC 
TACCCCGCTC TCGGCGTGGC GAGCGTCCTG GCCTGCCTGG TGGCCGCCGC CGTCGCCACC 
CGCCTACCGG AGCACCGCGA GCCGGCCGCC GGGCCGGGCG CCGACCCCGC CGACGGTGAA 
CACGGCTGGT GGGTCTCCCT GCGGGGCGGG CTGGCCGAGG CGCACGCCGA CCGGACGGTG 
CGCGCGGCGG TGCTGCTGGT CGCCGCCGTC GCCGCCGGAT GGGGGGCGCT CGACGAGTAC 
CTTCCGCTGT TGGCCCGAGA CGTCGGGGCG AGCGGGCCGG CCGTGCCGCT GCTGCTCGTC 
CTCACCTGGG TCGGTGTCGC CGTCGGCGGC CTGCTCGCCC CGGCGGGGGA GCGGCTGGGC 
CGCCGCGGGT ACGCCGGCCT GATCGGTGGG TCCGCCGGGG CGCTCGCCGC CGGCGCGCTG 
ATCGGTCACC CAGTCGGGTT CCTGCTGGTG GGCGTCGCCT TCTGCGGTTT CCAACTGGCC 
ACTGTGCTCG CCGACGTCCG GCTCCAGGCG CGGATCGTCG GCCCGGCCCG GGCCACCGTC 
ACCTCGCTCG CCGGGATGGC GACCGACACG ACGATCATCG CGTGCTACGT CGGGTACGGC 
CTGCTCGCCA CCGTCGCCGG CAACCGGGTC GCGTTCGCGG TGGCGGTGGC GCCCTACCTC 
GTCGTGGCGC TGCTGGTGGC CGTCGTACGA CCGGTCCGCC GATGA

Protein sequence

MISDTTPLRG GPHPGPIASP DRRARSLAAA LYGYAFLRDL VLLYPVYPLL FTDTGLTVWQ 
ISTLFVIWSA SSIVLEVPSG ALADAVSRRL LLCLAPLVTA AGFALWTLVP SYPAFAVGFL 
LWGVGGALAS GALEALVYTG LERLGAASRY ARVIGRARTA ETLGVLASLV LAAPVLALGG 
YPALGVASVL ACLVAAAVAT RLPEHREPAA GPGADPADGE HGWWVSLRGG LAEAHADRTV 
RAAVLLVAAV AAGWGALDEY LPLLARDVGA SGPAVPLLLV LTWVGVAVGG LLAPAGERLG 
RRGYAGLIGG SAGALAAGAL IGHPVGFLLV GVAFCGFQLA TVLADVRLQA RIVGPARATV 
TSLAGMATDT TIIACYVGYG LLATVAGNRV AFAVAVAPYL VVALLVAVVR PVRR