Gene Sare_1712 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1712
Symbol
ID	5703266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1982217
End bp	1983512
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	71%
IMG OID	641271215
Product	major facilitator transporter
Protein accession	YP_001536590
Protein GI	159037337
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00244455
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCACCA CCGTCCCACC GGCTGTCGGC GCTGCCGAGC CGGTACGCCG TCGCCTCCGG 
GTGCCACCGG GCGTCGCACT CGGCTTCCTC GCCTCGATCA TCGTGTCGTT CCTGGCCGCC 
TCCAGCGCGC CGACACCGCT GTACGACCTG TATGCGTCCA GGTGGGGATT CGCCGCGCTG 
ACCACGACGA TCATCTTTAG CGGGTACGCC GTGGCCGTCC TGGCGGCGCT CCTCGTGCTC 
GGCCGGGTCT CCGATCATGT CGGCCGGCGA CCGGTCCTGC TGGCGGCGCT CGCAGGCCAG 
GGCGTCGCGA TGCTGGTCTT CGCCACGGCC GGCGGTATCA CCGCGCTGGT GATCGCCCGG 
ATCATCCAGG GACTCTCCGC CGGCGCGGCG ATAGCCGCCG TCGGTGCGGG ACTGGTCGAC 
ATCGACCGGG CCCGCGGCGC CACCGCCAAT GCGGTCGCCC CCGCCATCGG CACGGCCACC 
GGCGCCCTGG CCTCGGCACT GATCGTCCAG TTCCTGTCCG CTCCCACCCA GCTCGTCTAC 
TATCTGCTGC TGACGATCTT CGTCGTCCAG GCGGTCGGTG TGGTCCTGCT TCCGGAGACG 
GCCCGGCCCA GGCCGGGAGC ACTGGCCAGC CTGGTTCCGC GACTGGCCCT GCCCCGCCAG 
CTGCGTCGCC CGGTCGCGGT CGCCGCACCG ACGCTCTTCG CGGTCTGGGC ACTGGCCGGA 
TTCCACGCCT CGCTCGCTCC CAGCCTCACC AAAAACCTAA TCGGGTCGAC CTCGGCCGGC 
TACGGCGGAC TGAGCTTGTT CTTGTTCATG ACGGTCGCGG CGACAGCGGT CTTCCTCCTA 
CGCGCCGCGC CGGCCCGCAT CGTGCTCGCC GTGTCGCTGC TGGCGCTGAT AGCCGGGGTC 
GGCGGTTCAC TCGTCTCGAT TGGCAGCGGC TCTGCCACGG GCTTCCTGAC CGGCAGTGCG 
GTGGCCGGCA TCGGCTTCGG CGCCGGCATG AACGGTGCCG TTCGGCTCGT GGTACCCCTC 
GCTGGGCCGC ACGAGCGGGC GGGGGTCCTC TCGCTGCTGT ATGCGGTGTC GTATCTCGGC 
ATGGGAGTGC CGGTCGTAGT CGGTGGAGTC CTGGTCGTGC ACGGCGGGGG TCTGCTGGCC 
ACCAGCCAGG GCTACGGGAT CGCCGCTCTC GTCCTCGCCG CCGTGGCGCT GGTCGGGCTC 
GGGATCAGCC GGCAACGAGC GGGTGACGTC GCCCACCAGG TGCCGATCCA GGCTCGTGCT 
GGTCGCCGGC CGTCGCCGTC AGGTTCGCTC AGGTAA

Protein sequence

MTTTVPPAVG AAEPVRRRLR VPPGVALGFL ASIIVSFLAA SSAPTPLYDL YASRWGFAAL 
TTTIIFSGYA VAVLAALLVL GRVSDHVGRR PVLLAALAGQ GVAMLVFATA GGITALVIAR 
IIQGLSAGAA IAAVGAGLVD IDRARGATAN AVAPAIGTAT GALASALIVQ FLSAPTQLVY 
YLLLTIFVVQ AVGVVLLPET ARPRPGALAS LVPRLALPRQ LRRPVAVAAP TLFAVWALAG 
FHASLAPSLT KNLIGSTSAG YGGLSLFLFM TVAATAVFLL RAAPARIVLA VSLLALIAGV 
GGSLVSIGSG SATGFLTGSA VAGIGFGAGM NGAVRLVVPL AGPHERAGVL SLLYAVSYLG 
MGVPVVVGGV LVVHGGGLLA TSQGYGIAAL VLAAVALVGL GISRQRAGDV AHQVPIQARA 
GRRPSPSGSL R