Gene Sare_4533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4533
Symbol
ID	5705974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5124058
End bp	5125503
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	68%
IMG OID	641273947
Product	major facilitator transporter
Protein accession	YP_001539296
Protein GI	159040043
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00237783
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGACGAGT GCTCGCGCGG ACGGGCCCGG CGGTGGTTGA TCGTCGCTGT TTGTCAGGTG 
GTCGTGTTCC TCGGGACGGT CACCACCGCG ATGTTGGTCA TCGCGATACC TCAGATCATC 
TCCACGATGG GCCTCGGCGA GGACGGCCAG CAGTGGGTGG TTGCCGGCTA CGCGCTGGCG 
TACGCCCTGA TGTTGGTGCC CGGCGGCCGG CTCGGTGACG TGTGGCGACG GCGTGCCGTC 
TTCGTGTCCA GCCTGGTGCT GAGCGGGGTG GCCGCCACGT CCGCCGCCCT CGCCCAGACG 
CCGGTCTGGC TGGTGCTGTC CGTGTTGGTG CAGGGCGGTG CACTCGGGGT GGTCAGCCCG 
CAGATCCTTG GGTTCTTTCA GCAGTTGTTC AACAAAAAGG AACGGGGCCG TCCGTACGGA 
TTGCTCGGGG TGGCGTTCGC CGTCGCCCTC GGGTCCGGAC CGGTCCTGGG TGGGGTGCTG 
GTCGACGTCA GCCCGGAAAA CGGTTGGCGA CTGATTTTCG TCGCGAACGC CTCGATCGCC 
TTCCTGGCGG CCACCCTGGG CTTTCTCCTG ATACCTGCGT TGACGACACC CCCGGATCGC 
TTCTGGTGGC GACGCACGGA CCCGGTAGGC GTCGTCCTGT TCGTCGTCGG GATGGTGGCG 
CTCTGGATTC CGATGGTGGA GGAGACGGCA CGGACCCCGG TCCTGTGGGT GCTGGCGCCG 
GTCGGCGCGG TCGTTCTCGT CGGCTTCGTG TTCTGGGAGC GGAGTCAGGC GAACCGGGGG 
TCACCGCTGG TCGACCTGGG CCTACTGCGG GTCCGGTCCT ACGGCCTGGG CGCGCTCATC 
GCGGTGTTGT TCGGCGCCTA CGACGCGCTG TACTACGTAC TCGCGCTCTA TCTGCAGGAT 
GGGGTGGGCC ACAGCCCTCT CACCACCGGG CTCGTCATGG CGCCGATCGC CGGGGGCACG 
GCGGCGGGGG CGGTCGTCGG GGGCCGGCTG GCCTGGCGAG CAGGTCGCCG GGTGGTAGCC 
CTCGGACTGC TGACGTCTCT TGTCGGACTA GCGGCGGTCA TGGTTGGTGA TCTCTTCCTG 
CCAACCTTCG ACAGTCCGCA CTCGGCCGCC CTGCCACTGC TGTTCGCCGG CCTCGGCGCG 
GGCTTCGTCC TCAGCGGCCT GGGTAGCGGA CTGACCAACA TCCCGAACCA GACCGTGACC 
ATGTCGCAGG TGCCCAACAC GCGGGCCGGC AGCGCTGCCG GAATGTTGCA CACCGGGCAC 
CGCCTCGGAA TCTCAGCCGG AATAGTCGGC GTCAGCACCG CACTGTTCGC AACGTTGGAC 
CGTACCGGCG GTAACTGGCT GGCGGCCTTC CGGACCACGC TGTTGATCAT CGCGGCGTTC 
ATCCTCGTCG CACTCCTGAT CGCCCTGATG GACATTGTCA CCAGGAAGGA GGGGCAGGTT 
CGGTGA

Protein sequence

MDECSRGRAR RWLIVAVCQV VVFLGTVTTA MLVIAIPQII STMGLGEDGQ QWVVAGYALA 
YALMLVPGGR LGDVWRRRAV FVSSLVLSGV AATSAALAQT PVWLVLSVLV QGGALGVVSP 
QILGFFQQLF NKKERGRPYG LLGVAFAVAL GSGPVLGGVL VDVSPENGWR LIFVANASIA 
FLAATLGFLL IPALTTPPDR FWWRRTDPVG VVLFVVGMVA LWIPMVEETA RTPVLWVLAP 
VGAVVLVGFV FWERSQANRG SPLVDLGLLR VRSYGLGALI AVLFGAYDAL YYVLALYLQD 
GVGHSPLTTG LVMAPIAGGT AAGAVVGGRL AWRAGRRVVA LGLLTSLVGL AAVMVGDLFL 
PTFDSPHSAA LPLLFAGLGA GFVLSGLGSG LTNIPNQTVT MSQVPNTRAG SAAGMLHTGH 
RLGISAGIVG VSTALFATLD RTGGNWLAAF RTTLLIIAAF ILVALLIALM DIVTRKEGQV 
R