Gene Strop_2303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2303
Symbol
ID	5058766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2599215
End bp	2600522
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	70%
IMG OID	640474565
Product	major facilitator transporter
Protein accession	YP_001159131
Protein GI	145594834
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.533597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.893433
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTAAAC CCCTGGTCCG GGCAGATCCG GCACCCCCGC GCCGGCCGCG CTTCCCGCGG 
CTGCTCCAAC AGACGGACTT CCGCCGCTAC TGGTCCGCCC AGACCGTCTC GCTCTTCGGC 
GACCAGATCA CCATGCTCGC CATGCCGCTG CTGGCCGTGC TCGCGCTCGG CGCCGGACCC 
GCCGAGATGG GCTACCTGAC CGCCGCCTCG CTGCTGCCGA ACCTGCTCTT CTCACTGCCA 
GCCGGCGCGT GGATGGACCG CTACCCGCGC CGACGTCAAG TAATGATCAT CGCCGACCTT 
GGCCGGGCGG GCCTTCTGCT GGCCGTGCCG CTGCTGTGGT GGGCGGACGC ACTCAACCTG 
CCGCTGCTCT GTGTCGTGGC CTTCCTGATC GGGGTCCTCT CGGTGTTCTT CGGGGTGGCC 
CACAGCAGCC TGTTCGCCAG CCTGGTCCAG CGGCAGAACT ATGTGGACGC CAACAGTCTG 
ATCAGCGGCA GCAGAGCCAT GTCCGACGTG GCCGGCCCGA GCATCGGCGG CGTACTCGTG 
CAGGTGCTCA CCGCTCCGGT CGCGCTGGTC GCCGACGTGC TCACCTACCT GACGTCGGCT 
GTCTTCCTGA CCCGGACAAC GGTCACCGAG CATCCCGCAC AGACCGGCCC CGGCATGGGC 
ATGGCCACCG GCGTGCGCTA CGTGGCCCGC TCCGCGGTGC TACGCGCGGT CCTGCTCGGC 
CTCACCACAC TCAACCTGTT CAATTTCATG TTCGCCGCGC TCTTCGTGCT GTACGTGACC 
ACCGAGCTGG GCGTCTCCCC CGGGGTACTG GGCCTGGTCA TCGGGGCCGG CGCGTTCGGC 
GGACTGCTCG GCGCGGCGGT CACCGGCCCG CTCAGTCGCC GGATTGGCAT CGGCCCGGCG 
GTGATTCTCG GCCTCGTCGT CTTCCCGGCC CCACTGATCC TCGTGCCGCT GGCCGGGGGA 
CCGCGGCCGC TGGTGCTCGC GCTGCTGCTC ACTGCCGAGT TCGTCTCCGC CCTGGGCGTC 
ATGATCCTCG ACATCGCCGC CGGATCGGTG CAGATCGCGG CCACACCGAA GACGATGCTC 
GCCGTGGTCT CCGGCGTCCG GCGCACCGTC AACTACGGCA TCCGGCCCGT CGGCGCGCTG 
ATCGGCGGCG CGCTCGGCGC CACGATCGGG GTCCGTCCCG CCCTCTGGAT CGCCAGCCTT 
GGTGCCCTGC TCGGAGCGTT CTGGGTCGTC TTCTCCCCGC TGCGCACCAT GCGTACCCTG 
CCCGAGGAAT GGCATCCGCC CGCGGCGGGC CCGGTGGGCA GCAACTAG

Protein sequence

MTKPLVRADP APPRRPRFPR LLQQTDFRRY WSAQTVSLFG DQITMLAMPL LAVLALGAGP 
AEMGYLTAAS LLPNLLFSLP AGAWMDRYPR RRQVMIIADL GRAGLLLAVP LLWWADALNL 
PLLCVVAFLI GVLSVFFGVA HSSLFASLVQ RQNYVDANSL ISGSRAMSDV AGPSIGGVLV 
QVLTAPVALV ADVLTYLTSA VFLTRTTVTE HPAQTGPGMG MATGVRYVAR SAVLRAVLLG 
LTTLNLFNFM FAALFVLYVT TELGVSPGVL GLVIGAGAFG GLLGAAVTGP LSRRIGIGPA 
VILGLVVFPA PLILVPLAGG PRPLVLALLL TAEFVSALGV MILDIAAGSV QIAATPKTML 
AVVSGVRRTV NYGIRPVGAL IGGALGATIG VRPALWIASL GALLGAFWVV FSPLRTMRTL 
PEEWHPPAAG PVGSN