Gene Sare_0459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0459
Symbol
ID	5705456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	527158
End bp	528603
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	72%
IMG OID	641269984
Product	major facilitator transporter
Protein accession	YP_001535379
Protein GI	159036126
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000150974
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGCGT CGCCGGCTGG GACCGGTCCA CCCGTTGCCG GCCCCACCGC CGCGTTGGCG 
TCGGCCGGTG CCGCCGCCGG TCCACCCCCG GCGGGGGTAC TGCCACGGCG GGTGCATGTG 
GGTTACGCGT CCGGATCGCT GGCCACCGGA GCCTTCGGCA CCGTGCCCGG GCTGCTACTG 
CTGCCCTACC TGACCGACAC GTTGGGCGTG ACGGCGGGTA TCGCCGCACT GCTCGTGCTG 
CTGCCGAAGG CGTGGGACGT GCTGGTCAAC CCGGTCGCCG GGCGGATCTC CGATCGCACC 
CGCTCCCGGT GGGGAGCTCG CCGTCCGTAT CTGTTCGGTG CCGGAATCGC GCTCGGTCTG 
TTCTTCGCCG CGATCTTCGC GGCACCGTTC GGCACCGGGG CGGCTGCCGG CGGGTACGTG 
GCGTTGACCT TCCTCGCCGC CGCGACCGCG TTCGCCTTCT TCCAGGTTCC GTATGTGGCG 
ATGCCGGCTG AGCTGACCAC CGGCTACGCC GAGCGTACTC GGCTGATGAC CTGGCGGATC 
GCGGTGCTGG CGCTGGCCAT TCTGGTCTCC GGCGCGGTGG CCCCACTGGT CCGCGACGCG 
GGCGGCGGCG GTCTCGCGGG GCACCGCTGG ATGGGGTTCT TCGTCGCCGG ACTGATCGTG 
CTGGGAGCCC TCGGGGCGTT CGTGGGCACC CGGTCCGCGC CGGTCGGCGC TGTGGCAGAG 
AACGAGCCGA CGCTGCGGGC CCAACTCGCG GTGGCCGGCC GCAACCGGGC ATTCCGGGCG 
TTGCTGGCCT GCTTTGTGAT TCAGTCCGCC GGAGTGGCGA CGATTCTGGC CGGGGTGAAC 
TACTTCGCCA CCCAGATCCT GCGCGACCCG GAGGGCGGGC CCACCATCCT GTTCGTCTGT 
TTCGTCGGGC CGGCGATCCT GGTCATGCCG GTGTGGAGCC GGGTCGGGCG GAGGTTCGGC 
AAGCTCACCG GGCTGGTCGC CGCCGCGCTC ATCTTCGCTG CCGGCGCACT GGCCCTGGTC 
ACCGCCGAGA TACTCCCCGC CGCCGGAATC TACCTGCTGG TCGCGCTGGT CGGCGTCGGG 
TACGCCGGCC AGCAGGTCTT CGCCCTCGCC ATGCTGCCCG ACTGCATCGC GTACGACGAG 
GCCCGGACCG GTCGGCGGCA GGCGGGCGTG TTCACCGGTG TGTGGACCGC CGGGGAGACC 
TTCGGCCTGG CGCTGGGGCC GGGCATCTTC GGGTTGGTAC TCCAGCTCTC GGGCTACCTT 
CCATCGGATA CCGGAGCCGC CGCTGCCCAG CCTGACTCCG CCCGGCTCGG CATTCTCCTC 
GGCTTCACCG TCCTTCCCGC CCTCCTGGTC GCCGCCGCCA CGCTGCTGCT GCGCCCCTAC 
TCCCTCACCC CGGCCGAGCT CGGCGCCGCC ACGGGCCCAC CGCCCGGCGC CAGGGACGCT 
CGATGA

Protein sequence

MDASPAGTGP PVAGPTAALA SAGAAAGPPP AGVLPRRVHV GYASGSLATG AFGTVPGLLL 
LPYLTDTLGV TAGIAALLVL LPKAWDVLVN PVAGRISDRT RSRWGARRPY LFGAGIALGL 
FFAAIFAAPF GTGAAAGGYV ALTFLAAATA FAFFQVPYVA MPAELTTGYA ERTRLMTWRI 
AVLALAILVS GAVAPLVRDA GGGGLAGHRW MGFFVAGLIV LGALGAFVGT RSAPVGAVAE 
NEPTLRAQLA VAGRNRAFRA LLACFVIQSA GVATILAGVN YFATQILRDP EGGPTILFVC 
FVGPAILVMP VWSRVGRRFG KLTGLVAAAL IFAAGALALV TAEILPAAGI YLLVALVGVG 
YAGQQVFALA MLPDCIAYDE ARTGRRQAGV FTGVWTAGET FGLALGPGIF GLVLQLSGYL 
PSDTGAAAAQ PDSARLGILL GFTVLPALLV AAATLLLRPY SLTPAELGAA TGPPPGARDA 
R