Gene Strop_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1823
Symbol
ID	5058282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2086167
End bp	2087561
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	74%
IMG OID	640474093
Product	major facilitator transporter
Protein accession	YP_001158663
Protein GI	145594366
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000162964
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.991228
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTACCC TCTCGGTCCA TCAGGTCCGC CACCGCTATC TCATCCTGCT CGGCCTGCGC 
TGGCTGCCGG TCGGCCTGCT GGTTCCGGTC TTCGTCCTGC TGATGCAGGA GCGGGGCCTC 
ACCCTTGCCG AGATCGGCAT GGCGTTCGCG GCCCAGGGTG TCCTCGTCCT CGCGCTCGAG 
TTGCCGACCG CCGGGCTCGC CGACGCCGTG GGACGCCGGC CGGTGCTGGT GCTCGCCGCG 
GTGGTCAACC TCGCCTCCGT GGCGCTCTTC GTCGTGGCCG ACTCGTTCGC CCTACTGGTG 
GCGGTGTGGG CGTTGCAGGG GGTCTATCGG GCGCTGGACA GCGGCCCGCT CGAGTCCTGG 
TTCGTGGACA GCACCCTCGC CGCCGACCCT GAGGCCGAGT ACGAGCGGGG CCTGAGCCAG 
GGCGGGACGG CGGTCGGCGT CGCCATGGCG GCCGGTGCCC TGCTCAGCGG CGGGCTGGTC 
GCGTTCGGCC CGGTCGGCCC GTTCAGCGCG TTGACCATGC CGATCGTGGC CATCGTGGTG 
TTGCAGGTCG TCGGGCTGGT GGCCCTCCTC GCCCTGCTGC GCGAGCGTCG TCCCACCGCC 
GGGTCGTCGG CGCTACGCGA GTCGATCGCG GAGGCCCCCC GGATGATCGG CCAGGCGATG 
GGGCTGCTGC GCCGCTCCCG GGTGCTGCTC GCCCTGCTCT CGGTCGAGCT CTTCTGGGGC 
TTCGGCATGG TCACTTTCGA AGCTCTCCTG CCGGTCCGAC TCGCCGAGGT GCTCGGCGAC 
GCCGATCGGG CCGGGGCGCT GCTCGGGCCG GCGACCATGG TGGCCTGGCT CGCGAATGCC 
GGCGGCGCGG CGGCGACCCC GCTGCTCACC CGGCGACTGG GCGCCGCGCC CGCCGCGGCG 
CTGCTGCGGA TCGCGCAGGG CGTCACCGTG GTCGGGATGG CGCTGCTCGC CGGTCCGGTC 
GGCGTGCTGG TCGCCTTCGT CGTGTGCTAC GTCGTGCATG GCGCCTCGAA CCCGTTGCAC 
ATGGGGCTGG TGCACCGACA GGTCGACGGG CCGTACCGGA CCAGTGTGGT GTCCCTGAAC 
TCGATGGTGT CCATGCCCGC CGGTGCCGCC GGGGGGATCG TGCTCGGCCT GGTCGCCGAC 
CGTGCCGGCG TCAGCGTCGC GATGCTGGTC GGCGCGGTCG TGCTCGTGAT TGCCGCGCCG 
CTGTACCTGC CCGCCTGGCG GGCGAGCCGG GACGGTTCTC CCGCCCCGGT CGGTGCGCCA 
ACGGCCGCCG CCTCCCCCGA GCCCCCGGAA CCGGCGACCC AGCCCGACAC CTCGGCGCCG 
GTCAGTGGGC AGCCCGGCGT GCCCCCGGCT CGCGACGGTG ATCCGACAAC CGGCGCGGGC 
GCGGCACGGC GCTGA

Protein sequence

MATLSVHQVR HRYLILLGLR WLPVGLLVPV FVLLMQERGL TLAEIGMAFA AQGVLVLALE 
LPTAGLADAV GRRPVLVLAA VVNLASVALF VVADSFALLV AVWALQGVYR ALDSGPLESW 
FVDSTLAADP EAEYERGLSQ GGTAVGVAMA AGALLSGGLV AFGPVGPFSA LTMPIVAIVV 
LQVVGLVALL ALLRERRPTA GSSALRESIA EAPRMIGQAM GLLRRSRVLL ALLSVELFWG 
FGMVTFEALL PVRLAEVLGD ADRAGALLGP ATMVAWLANA GGAAATPLLT RRLGAAPAAA 
LLRIAQGVTV VGMALLAGPV GVLVAFVVCY VVHGASNPLH MGLVHRQVDG PYRTSVVSLN 
SMVSMPAGAA GGIVLGLVAD RAGVSVAMLV GAVVLVIAAP LYLPAWRASR DGSPAPVGAP 
TAAASPEPPE PATQPDTSAP VSGQPGVPPA RDGDPTTGAG AARR