Gene Sare_3129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3129
Symbol
ID	5706373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3557189
End bp	3558733
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	67%
IMG OID	641272561
Product	major facilitator transporter
Protein accession	YP_001537928
Protein GI	159038675
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.91445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000257265
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCCTCCC GGCCTGGCCG GTCATCGCCG TCGCGACGGG CCGCCCTGGT CGGCCTGTGT 
ACCGCCGCCA CCCTGGTATG GCTCGCGTTC TCCAACCTGG GTGTGGCGCT GCCGACGATC 
GCCACCGAGT TGAGCGTCAA CCTGACCGAC ATGCAGTGGG CGAACAACGC CCTGAGTATC 
GCCTGCGGCA CACTCCTACT GGCCGGCGGA CGCCTCACCG ACCTCTACGG CCATCGACAG 
ATGCTGCTCC TCGGCCTACT GATCTTCGGT GTTGCCGCGC TGGCGACCGC GTTCACACCC 
AACCTCGCCG GCCTGGTCAC CGGTCGGGCG ATGATGGGCG TCGGCAGCGC ACTCATCCTG 
CCCGCCACGC TAGCCATGAT CCCGGCCCTG TTCGACCGAG CCGAGCAACC CTCAGCATTC 
GCCGCATGGG CCGCGGCCAC TTGGGCGGGG CAGGCGGTCG GGCCCGCCAT CGGCGGAACA 
CTGACCACCC TGTTGGGCTG GCGGTCGCTG TTCTGGCTCA CCGCACCCGT GGTCCTCGTG 
CTGTACCTGA CAATCAGACG CGACGCCCCC ACCGCAACCA GGGGCCACGG ACGAGTCGAC 
CTGATCGGGC TCATTACCGG CGCCGGAACG GCACTGTGTC TACTTTTCGC ATTGACCGAG 
GGCCAGCAGG TCGGCTTCAA CGACCCGCTC ATCATCGCTT TGTTCGCCGC GACGTTGGCG 
CTCGGCGCGG CGTTCGTGTT CGTCGAACTA CGGATCAGCG ACCCGCTGGT GAACCTACGG 
CTGTTTCGCA CCCGCAGCTT CGACGGCGCC CTCATCGTCA ACCTCACGAT GAACATGTCC 
TTCGCCGGCG CACTGTTCGT GCTGTCCCTC TACCTCCAAG ACGTCCGCGG CTACACCGCA 
TTCATCGCCG GCCTGATCCT CATCCCCGCC GCCGCAACAA TCCTGATCTT CAACACCATC 
GGCGCCCGAA TTCTCACCCG ACACGACCCC CGCGCCCCCT CAATCTGGGG CCTCGTCCTG 
GTCGGCATCG GCAGCATCGC CATCAGCACC CTCCTACCCG CCCTGTCCGT CCTCGCAGTA 
ATCCTGGGCC TGCTCATCGT CGGCGCCGGA CTGGGCCTGC TGTCCGTACC CGTCGCCGAC 
ACCATCGTCG CAGGCCCACC AACCACCCTC GCCGGCACCG CATCCGGGGT ATACAAAACC 
AGCAGCATGC TGGGCGGCGC ACTCGGCGTC GTCCTACTCA CCGCCGCAAC AACCCGCTTC 
GGCCGCGCCG AAGCCGCACC AGTCAGCACC GCCGCCGGAC TCACCGAAGC GGAATCCAAC 
CAGGTCGTCA ACGCACTGAC CAACTCCCAG ACCGCGAGCG CCATCCTCGA CAAACTCCCA 
GCAAGCCAAC GCTCCCTCGT CATCGAGGTG TATCACCAGG CATTCTCCGA CGGGGTGTCC 
ACAGCCCTCA TACTCGGAGG CGTGATCGCA CTGGCCGGCG CGGTGCTGGC CGGCTGGATC 
TGGCCCCGCA GGAAGGGCCG ACGCGCGAAG GCGACCCGGA CCTGA

Protein sequence

MSSRPGRSSP SRRAALVGLC TAATLVWLAF SNLGVALPTI ATELSVNLTD MQWANNALSI 
ACGTLLLAGG RLTDLYGHRQ MLLLGLLIFG VAALATAFTP NLAGLVTGRA MMGVGSALIL 
PATLAMIPAL FDRAEQPSAF AAWAAATWAG QAVGPAIGGT LTTLLGWRSL FWLTAPVVLV 
LYLTIRRDAP TATRGHGRVD LIGLITGAGT ALCLLFALTE GQQVGFNDPL IIALFAATLA 
LGAAFVFVEL RISDPLVNLR LFRTRSFDGA LIVNLTMNMS FAGALFVLSL YLQDVRGYTA 
FIAGLILIPA AATILIFNTI GARILTRHDP RAPSIWGLVL VGIGSIAIST LLPALSVLAV 
ILGLLIVGAG LGLLSVPVAD TIVAGPPTTL AGTASGVYKT SSMLGGALGV VLLTAATTRF 
GRAEAAPVST AAGLTEAESN QVVNALTNSQ TASAILDKLP ASQRSLVIEV YHQAFSDGVS 
TALILGGVIA LAGAVLAGWI WPRRKGRRAK ATRT