Gene Sare_0401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0401
Symbol
ID	5703794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	461832
End bp	463184
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	70%
IMG OID	641269926
Product	major facilitator transporter
Protein accession	YP_001535321
Protein GI	159036068
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0878696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0116181
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGACGA TGCGAGGTTG GCTACACGAT ACGGCCGGCG GCCTTCCCCG CACGTTCTGG 
TATCTGTGGA CCGGCACCCT GATCAACCGG CTCGGCTCGT TCGTCATCAT CTTCCTCGCC 
ATCTACCTCA CCCAGGAGCG AAACTTCTCC GCCTCCCAGG CGGGCCTGGT GCTGGGTCTC 
TGGGGGGTCG GCGGCGCGGC GGGCACCACC ATCGGTGGCA CGCTCGCGGA CCGGTGGGGC 
CGCCGCCCCA CCCTGCTCAC CGCGCACCTC GGCGCCACGA GCATGATGCT CGCCCTCGGC 
TTCGCCCGGG ACCTGTGGTC GGTCGCACTC GGCGCCCTGC TGCTCGGACT CTTCGCCGAG 
GCCGCGCGAC CCGCGTTCGG CGCCATGATG ATCGACGTCG TGCCGGACAA GGACCGGTTG 
CGGGCCTTCA GCCTGAACTA CTGGGCGATC AATCTCGGCT TCGCCTGCGC CGCGGTCCTC 
GCGGGATTCG CGACCGAGGC TGGCTACCTG CTGCTCTTCG TGGTGAACGC GGCCACCACC 
CTGACCACCG CACTGATCAT CTTCGTCAAG GTCAGCGAGA CCCGCAAGCC GCTGGTCACC 
GCCGCCGGGC GACCGACCGC ACCGCCCCGG GCGCTGCGCA CCATCCTGGC CGACCGCGTC 
TACCTCGGGT TCGTGGCGTT GAACCTCTTC GCCGCGTTGG TCTTCCTCCA GCACATCTCG 
ATGCTGCCGA TCGCCATGGG CGACTCGGGG CTGAGCCCCG CCACGTACGG CTCGGTGATC 
GCACTCAACG GTGTGCTGAT CGTGGTGGGC CAACTCTTCG TACCACGGTT GATCAAGAAC 
CGTAGCCGCT CTCACGTGCT GGCGCTGTCG GCGGTGGTGC TGGGGGTCGG ATTCGGCCTG 
ACCGCCTTCG CCGAGACCGC CTGGTTCTAC GGTCTGACCG TCCTGATCTG GACTCTCGGC 
GAGATGCTCA ACTCGCCGTC CAACGCCACC CTGATCGCCG AACTCTCCCC GAGTGAACTG 
CGCGGTCGAT ACCAGGGAGT CTTCTCGCTC TCCTGGCAGG TAGCCGGCGC CACAGCGCCA 
GTGCTCGGCG GGGTCGTCCG GGAGCGGGCC GGCGACGACA TCCTCTGGCT GGGCTGCGCC 
CTGATCGGCG GGTTGGTGGC GGCGGCGCAC CTGATCTCCG GGCCGACGCG GGAGCGCCGG 
GTCACCGCCC TGCGGGCGGC CAACCAGTCG GTGCAGCCGG CCGCGGTCGG GGGCCGGCGC 
GCGGCCGAGG CGGAAGAGGC CGTCACGACC GCACCGGCCG AATCGCTCCC GACGGGATCC 
GCCGAGAGCA CGGCGGCCGG TCGGGTTCAG TGA

Protein sequence

MRTMRGWLHD TAGGLPRTFW YLWTGTLINR LGSFVIIFLA IYLTQERNFS ASQAGLVLGL 
WGVGGAAGTT IGGTLADRWG RRPTLLTAHL GATSMMLALG FARDLWSVAL GALLLGLFAE 
AARPAFGAMM IDVVPDKDRL RAFSLNYWAI NLGFACAAVL AGFATEAGYL LLFVVNAATT 
LTTALIIFVK VSETRKPLVT AAGRPTAPPR ALRTILADRV YLGFVALNLF AALVFLQHIS 
MLPIAMGDSG LSPATYGSVI ALNGVLIVVG QLFVPRLIKN RSRSHVLALS AVVLGVGFGL 
TAFAETAWFY GLTVLIWTLG EMLNSPSNAT LIAELSPSEL RGRYQGVFSL SWQVAGATAP 
VLGGVVRERA GDDILWLGCA LIGGLVAAAH LISGPTRERR VTALRAANQS VQPAAVGGRR 
AAEAEEAVTT APAESLPTGS AESTAAGRVQ