Gene Sare_0968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0968
Symbol
ID	5703637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1091097
End bp	1092482
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	71%
IMG OID	641270484
Product	major facilitator transporter
Protein accession	YP_001535871
Protein GI	159036618
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.335607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00724126
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGGAATAC GCCCAGCCGT CATGCTGGTC GCCGTGCTGG CGTCGACCTT CGCGCTGCCG 
CTCTCGCTGA CCGGGGCCTC GGTGGCGTTG CCCGAGATCG GGCGGGATCT CGATGCGGAC 
CTGGCCGGGG TGCAGTGGGT GGTCAACGGG TACAACGCCA CCTTCGCCAG CTGCATGCTC 
GCCGCGGGTG CCCTGGCCGA CCTGTTCGGC CGGCGACGGC TCTATGCCAC CGGAGTCGCG 
GTTTTCGCCG CGGCGGGGTT GCTCGCCGCC GGCACCGACG ACATCCTGCT GCTGAACCTG 
CTGCGTGCAC TCGCCGGTGT CGGTGCGGCA GCCGCCGCGA CCAGCGCGGG GGCGCTGCTG 
GCGGCTACGT TCAGGGGCGG TGCCCGGGCG CGTGCGTTCA GTGTCTTCGG TATGGCCATC 
GGTGCTGGCC TGGCTTTCGG TCCGTCGATC GCCGGAGTGT TGATCGACGT TCTGGGGTGG 
CGGGCGGTGT TCGCCGTGCC CGCGTTGGCG GGGGTGGCGG TGCTGCTGCT GGTCCCGTGG 
CTACCGGAGT CGCGTCAGCC GTATGCCGGC CGAATCGACT GGGGTGGAAC CGTCACGTTC 
ACGGCCGCAC TGCTGCTGTT GATCTTCGGC TTCGTGCAGG GGCCGGAGTA CGGCTGGGAC 
GACCCGAGGA TCGTTGCCGC ATTCGCGGCG ACGGTGGCGT TCTTTGTCGC CTTCGTCCGG 
GTGGAGCGGT CCCACCCCGA GCCGATGTTC GACCTGACCC TGTTGGCCAA CCCCCGCTTC 
GTCGGCATCT GCCTGGCGGC AGCCACCACC GTCGCCGTCC TGGTGCCGCT GTTGGTGTAC 
CTGCCGTCCT ACCTCACGAC GGTGATCGGC CTGACCCCCA GCGCCGCCGG GGCGACCTTG 
ATCCTGCTGA CCGCGCCGAC GGTGGTGCTG CCGCTGATCG CCGGGGCACT GACCCGCTGG 
GTGTCAGCGT CGACAGTGAT TGTCGTCGCC GTCGTCGCGG TCGCGTTGGG TGCAGCCTGG 
GCGACGGTGA TCGCCCCGAC CAGCGGCCTG GCCGACCTGG CCGGCCCGCT GCTGGCCATT 
GGCCTCGGTA TCGGCCTGTC CATCGGGCTG CTCGACGCGC TCGCCATCGG CAGCGTTCCC 
CCGCACCGGG CCGCCACCGG CGCCGCAGTG ATCAACACTG CTCGGTTGGC GGGTGAGACC 
GTCGCCATCG CGGTCGTCGG CGCGGTGCTG GCGAGCACCA CCGCGGGCCG GCTCGCTGAT 
CCCGGCTTCA CCAGCGGTCT GCGTACCGTG CTCTGGGCCA TGGCCGGTGC GGCGGCGCTC 
GCCGCGTTGA CCGTCGCGGT GCTGGTCCGT CGGAGTTCGC GCCGTTCGGT GACCGTCGCC 
GGGTGA

Protein sequence

MGIRPAVMLV AVLASTFALP LSLTGASVAL PEIGRDLDAD LAGVQWVVNG YNATFASCML 
AAGALADLFG RRRLYATGVA VFAAAGLLAA GTDDILLLNL LRALAGVGAA AAATSAGALL 
AATFRGGARA RAFSVFGMAI GAGLAFGPSI AGVLIDVLGW RAVFAVPALA GVAVLLLVPW 
LPESRQPYAG RIDWGGTVTF TAALLLLIFG FVQGPEYGWD DPRIVAAFAA TVAFFVAFVR 
VERSHPEPMF DLTLLANPRF VGICLAAATT VAVLVPLLVY LPSYLTTVIG LTPSAAGATL 
ILLTAPTVVL PLIAGALTRW VSASTVIVVA VVAVALGAAW ATVIAPTSGL ADLAGPLLAI 
GLGIGLSIGL LDALAIGSVP PHRAATGAAV INTARLAGET VAIAVVGAVL ASTTAGRLAD 
PGFTSGLRTV LWAMAGAAAL AALTVAVLVR RSSRRSVTVA G