Gene Sare_3189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3189
Symbol
ID	5705802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3679093
End bp	3680421
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	68%
IMG OID	641272620
Product	major facilitator transporter
Protein accession	YP_001537987
Protein GI	159038734
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00704959
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGTGAAC TACTGAGCAA TCGAACCTAC CGCCGGCTGT TTACCGCCCA GGTAATCGCA 
CTCGTCGGCA GTGGTTTGGC GACGGTGGCG CTCGGGCTGC TCGCCTACGA CCTCGCGGGC 
GCACGGGCCG GGGAGGTCCT AGGAACCGCG CTGGCGATCA AGATGGTCGC GTACGTGTGC 
GTATCGCCGC TGGTCGGTGC GGTGTTGGAC CGAGTGCCGC GCGGTGTGGT GATGGTGGGC 
TCGGACCTGG TCCGATGCGG AGTCGTCCTG CTGCTGCCGT GGGTCGACGC GATCTGGCAG 
GTCTACGTTC TCATCGCCGT ACTGCAGGCC GCGTCGGCCG CCTTCACGCC CACCTTTCAG 
TCCGTACTCC CGGACGTCAT TCCGGACGAG GACGACTACA CGAAGGCGTT GTCCGCGTCG 
CAGGTGGCTG TCGCTCTGGA GAACATCGCC AGCCCGGTCA TCGCCGCCGC GCTGCTACTC 
GTCATGAACT TCAGTGTTCT GTTCGTGGGA ACGGCGGTGG GATTTCTCGC TTCCGCGCTG 
TTCGTCAGTG CGGCAACGGT TCCCAGGGCA CGACGTAGCA GCCGTGTCCG CTTCTCCGCG 
CGTCTGCTCG CCGGACTGCG CGTGTTCGCG GGCACGCCAC GGCTACGGGC GGTCCTGGCG 
CTGAACATGG TGGTCGCTGG CTCGGGCGCC GTCACCCTGG TCAGCACCGT CAACGTCGTA 
CGTGACCTGC TGGACGCCAC CGAATCACAC GTGCCGCTCC TGCTTGCGGT CTCCGGCCTC 
GGCACCGTCA CCGCGGCGTT CGGCGCACCA CTGCTGCTGC GTCGACTGAG AGACCGACGC 
ACGCTGCTCG CCGGTGCCGC CACGGCCGTG CTCGCACTGG CGGGCGCACT GGTGTTGTCA 
ACCGTACCGT CCTGGTTCCT CGCGATCTGG GTGTGGCTAC TCATCGGCTT TGCCGGCGGA 
TTGATCATCG TCACGATCAA CCGGGTGCTG CGCGCATCGT CGACCGCCTC CGACCGGCCG 
GCCCTGTTCG CCGCCCAGTT CTCCCTGTCG CACCTCTGTT GGCTGATCAC CTATCCCCTC 
ACCGGCTGGG TGGGGGCGAC CGTCGGCTTC ACCGCGGCAT GGTCGCTGCT CATGGGCCTG 
GTGCTCGTGG CTGGACTCGC CGCCACCTGG CTCTGGCCGG CCCGCCTTCT CGAGACCTTC 
CGGCATCAGC ATGGCGCCGA TACGGACCAC GAGCACCTGG ACGACGCCGA GTGGGACGGG 
GCGGCCTGGG TGCACACCCA CCGCGTCCAG ATCGACGGCA ACCACACGCG ATGGCCCCAA 
CCCGTGTGA

Protein sequence

MRELLSNRTY RRLFTAQVIA LVGSGLATVA LGLLAYDLAG ARAGEVLGTA LAIKMVAYVC 
VSPLVGAVLD RVPRGVVMVG SDLVRCGVVL LLPWVDAIWQ VYVLIAVLQA ASAAFTPTFQ 
SVLPDVIPDE DDYTKALSAS QVAVALENIA SPVIAAALLL VMNFSVLFVG TAVGFLASAL 
FVSAATVPRA RRSSRVRFSA RLLAGLRVFA GTPRLRAVLA LNMVVAGSGA VTLVSTVNVV 
RDLLDATESH VPLLLAVSGL GTVTAAFGAP LLLRRLRDRR TLLAGAATAV LALAGALVLS 
TVPSWFLAIW VWLLIGFAGG LIIVTINRVL RASSTASDRP ALFAAQFSLS HLCWLITYPL 
TGWVGATVGF TAAWSLLMGL VLVAGLAATW LWPARLLETF RHQHGADTDH EHLDDAEWDG 
AAWVHTHRVQ IDGNHTRWPQ PV