Gene Strop_1095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1095
Symbol
ID	5057542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1241943
End bp	1243184
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	73%
IMG OID	640473362
Product	major facilitator transporter
Protein accession	YP_001157944
Protein GI	145593647
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.522817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.816365
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCGG AGGTACGGAC CAACGTGAAC CTGAAGCCTT ACCGGGCGGC GCTCGCCCTG 
CCCGGTCTCC GGGCCCTACT GATCGTGGCG GTGCTCGCCC GGATACCGCT CACCACGATC 
GGTCTGACCC TGACGTTCTA CGTCGTCCAG GACCTCGACC GAGGGTACGG CGCGGCCGGG 
CTGGTCGGCG GCGCGATCAC CGTCGGCGCG GCCCTCGGCG GCCCGCTGCT GGGTCGTCTG 
ATCGACCGGC GCGGCCTTCG GCCGGTGCTG GTGCTGACCG CCGTCGCCGA AGCGGTGTTC 
TGGTCCACCG CGCCGCTGCT GCCGTACGCG CTGCTGCTGC CCGCCGCGTT CCTCGCCGGT 
ACGCTGGCGC TGCCGATCTT CGCGGTGGTC CGCCAGTCCA TCGCGGCCAT CGTGCCGGCG 
GAGAAGCGCC GGCCGGCGTA CGCGCTGGAC TCGGTGTCGG TGGAGTTGTC CTTCATGATC 
GGGCCGGCTC TGGCCACCCT CGCGGTCACC ACCATCTCCG CCCGCACCAC GCTGTACCTG 
GTAGGCGCCG CCATCGTCGC CGCCGGCATC GGGCTCTTCC TGCTCAACCC GCCGATCCGG 
GGCGCCAGCG AAGCGACCGG GCCGCGACGA AAGGTGCCGC GGCGGGAGTG GCTCACCGCC 
CGGATGATCG CCGTGCTGGC AATCACCGCC GCCGCCACCA TGGTGCTGGG CGGCACCGAC 
GTCGCCGTGA TCGCGGTCCT GCGCGACAAC GGCGACGTGG GCTTCACCGG CGTGGTGCTG 
GGCTTCTGGG CACTCGCCTC GCTGCTCGGT GGCTTCGCGT ACGGGGCGAT CACCCGCTCC 
CCGTCTCCGC TGGTGCTGCT CGCGGCGCTG GGCATCGCCA CGATCCCGGT CGGGCTGGCC 
GGCGCGAACT GGTGGCTGCT CAGCCTGGTG CTGATCCCCG CCGGCCTGCT CTGCGCCCCC 
ACCATCGCCG CCACCTCGGA TGCGGCCAGT CGACTGGCGC CCGCGGACGC CCGCGGTGAG 
GCGATGGGGC TGCACGGCTC CGCCAACACC GTCGGCGTCG CGGTCGGCGC CCCACTGGCC 
GGAGCCGTCA TCGACGCCTC CGCGCCGGCC TGGGGCTTCG CCGTGACCGG AGCGGTCGGT 
GCACTGGTCG CTCTGGCGGT ACTCCCGGTG CAGTTGCGCC GCCGTCGGGA AGCCGAAGCA 
CCGGCCCCCG TTCCCGAGCC CGAGCTGACC CACACTGCGT GA

Protein sequence

MSPEVRTNVN LKPYRAALAL PGLRALLIVA VLARIPLTTI GLTLTFYVVQ DLDRGYGAAG 
LVGGAITVGA ALGGPLLGRL IDRRGLRPVL VLTAVAEAVF WSTAPLLPYA LLLPAAFLAG 
TLALPIFAVV RQSIAAIVPA EKRRPAYALD SVSVELSFMI GPALATLAVT TISARTTLYL 
VGAAIVAAGI GLFLLNPPIR GASEATGPRR KVPRREWLTA RMIAVLAITA AATMVLGGTD 
VAVIAVLRDN GDVGFTGVVL GFWALASLLG GFAYGAITRS PSPLVLLAAL GIATIPVGLA 
GANWWLLSLV LIPAGLLCAP TIAATSDAAS RLAPADARGE AMGLHGSANT VGVAVGAPLA 
GAVIDASAPA WGFAVTGAVG ALVALAVLPV QLRRRREAEA PAPVPEPELT HTA