Gene Sare_0236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0236
Symbol
ID	5705964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	265560
End bp	266768
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	69%
IMG OID	641269766
Product	major facilitator transporter
Protein accession	YP_001535162
Protein GI	159035909
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00072705
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATGCCGT TCATGGTCAC GAATACCATG ACATTGGGAC GGCCGTTCTG GACGTTTTGG 
AGCGCCACGG CCCTCGCCAA CGTGGGTGAT GGGATTCGGC TGGCGGCGTT TCCTCTGCTC 
GCCGCGTCGT TGACGGCCAA CCCGGTTGGC GTGGCCGCGG TGACCGCGGC CCAGGCCCTG 
CCCTGGTTGG TGACCGGTCT ACTCGCCGGG TCGCTGGCCG ACCGCCGCGG CGCCCGTACT 
CTGCTCGCCC AGGCCGACAT CGCCCGGGTA GTCGTCCTGG GCGTTCTGGT CGTCGCCGTG 
GCGATGGGCT GGGCGTCCCT GCCGCTTGTC CTACTGGCCA GCTTCCTGCT CGGTGTCGGC 
GAGACCGTGC GCGACACTGC CGCACAGACA GCACTTCCCG GCCTGGTGCC AGAGCGACTG 
CTCGAGCGCG CCAACGGAAG GCTGGTCGCC GGCGAAATCG TCGGTAACGA GTTTGTCGGC 
CCGCCGGTCG GCGCCGCGCT GTTCGTGGCG GGCGCGGCGT TGCCGTTCGC GACGAATGGC 
GCGTCCCTCG CCCTGGCCGT CATGCTCGTG CTGACCCTGC CGCTGAGCGT GGCCGCCCGT 
CCACCGCAGG ACGCGCCGAC GCACGTCAGG CAGGGTGTGG TGGCGGGCCT GCGATGGCTG 
GCACGCCATC GCGTGCTCCG AACACTCGCG CTGGTCACCG CTGCGGTCGC CGCCGCTGAC 
AGCGCATGGT TCGCGGTCCT GGTGCTCTAC GCGACAGACC GGCTCGGCAC CGGCGCGGCT 
GGCTTCGGAG TCCTGCTCGC CGCCGGAGCC CTCGGCGGCC TTCTTGGCTC GTTCCTCGTT 
GACCGGCTCG TCGCGGGCCG CCGGCACCGT GCGATCATCA CTTGGTCGCT GGCCATCACC 
GCCGGTATCC CCGCGGTGCT CGCCGTGACC TCTCAATTGT GGGCGGCGAT ACTCGTCATC 
GTGGTCACGA GTGGCTCGTT CGCTGTACTC AACGTCACTG TCGTGTCACT GCGTCAACGC 
CTGGTGCCCC GCGAGTTGCT CGGGCGTGTG GTAGCAGCCG GCCGCACACT GAGCTTCAGC 
GCCGCCGCCG CGGGTGCATT GCTTGGCGGT GTGCTCACGG CGACGATCAC AATCGAGGCG 
ACGTTCATTT TCAGCGGACT GGTCGCAGTT TCGGCGACCA TCGCATGGTG GGTTGCGTCC 
CGGCCCTGA

Protein sequence

MMPFMVTNTM TLGRPFWTFW SATALANVGD GIRLAAFPLL AASLTANPVG VAAVTAAQAL 
PWLVTGLLAG SLADRRGART LLAQADIARV VVLGVLVVAV AMGWASLPLV LLASFLLGVG 
ETVRDTAAQT ALPGLVPERL LERANGRLVA GEIVGNEFVG PPVGAALFVA GAALPFATNG 
ASLALAVMLV LTLPLSVAAR PPQDAPTHVR QGVVAGLRWL ARHRVLRTLA LVTAAVAAAD 
SAWFAVLVLY ATDRLGTGAA GFGVLLAAGA LGGLLGSFLV DRLVAGRRHR AIITWSLAIT 
AGIPAVLAVT SQLWAAILVI VVTSGSFAVL NVTVVSLRQR LVPRELLGRV VAAGRTLSFS 
AAAAGALLGG VLTATITIEA TFIFSGLVAV SATIAWWVAS RP