Gene Strop_3945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3945
Symbol
ID	5060426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4498504
End bp	4499769
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	69%
IMG OID	640476205
Product	major facilitator transporter
Protein accession	YP_001160753
Protein GI	145596456
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.736514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATCGCCC TCGAAGACCT ACCTCCGGGT GGTGTGGGCG TAACGGCGGG GCGGCGACTG 
CCCACCTCGT ACCTGCTCTG GCTCGCCGGG ATCCTCGCCT CGCTGCTGGG CAACTCGCTC 
TTCTACTTCG CCCTCGGTTG GGAGGCGAGT GCGCACGGCG GTGCCGTCGC CGGTCTTGTT 
CTCACCGCCA TCACGCTGCC GCGGGTGCTG CTGCTCCTGA TAGGTGGAGC GGTCGGGGAC 
CGGGTGAGTG CCCGTCGAGT TCTCATCATC GGCGATGCCG TGATGCTTGT CTTCTCCGTC 
GCCCTGGCGG CGTCGGCCTA CCACCTCGGG GCGCCGCCCT GGCTGCTGAT CGCCGCCGGC 
GTCGCCGTGG GGGTCGCGGA CGCCTTCTAT CTGCCAGCGT CCGGATCGAT GCCGCGACGG 
CTGGTAAGCC AGGACCAACT TTCGCAGGCC CTGGCGTTGC GCCAGGTTGG CGGTCAGCTG 
GTCGCCATGG GCGGCGGTCC GCTCGGCGGC GTTCTCGTCG GGTTGGCCGG GTTGGCGGGG 
GCCGCCCTGG TCAACGCGGT GACCTTCGCC GCGGTGCTGA CGCTTCTGAT CATCATCCGG 
CCTCGGTACA ACGGGCCCGC CACCGCGCGC AGCGGAGGGG TTGTGCGCGA CGCGGTCGAC 
AGCATCCGCG TCGGCTTCCG TGATCCGGTC CTGCGTCCCG GGCTAACGCT GACCGGGGCC 
GCGGCAGGTT TCCTGCTTCC GGTGCTTCCG TTGCTGGTCC CACTGCTTGC GCGGGCGGAG 
GACTGGGGGG CGGCGGCTGG TGGTCTGATC TTTGGGGCGC AGGGCGTTGG TATGGCCATC 
GTCACCCTGG CTGTCGTGCG TCGCGGCCCG CTCGGCCGGC CCGGTCTACT CGCTGCCTGC 
GGCCTATTGA TCGCTGGTGC TGGAGTTGCT GGGCTGGCGC TCTCCTCCAC TGTGGGGATC 
GCCGTCGGCG TGGGGCTGAT CATGGGGTTC GGGAGTGGGC TCTTCGCCTC GCACCTGGGT 
CCGCTGATCC TCGGCGTGAC TCCGGACACT CACCTCTCTC GCATTCAGGC CCTGCTGACA 
CTGGTGCAGA GCCTGGCTTC GTTGATCATG GTTAATGTGC TCGGCCTCAT CGTCGATCAC 
CGCGGAGCGG CGGTGGCGAT CCTGATCTGC GCAGCGGCCA CGAGCTGCGT TGGGCTGCTG 
GGCCTACGGT CCGCGCCGCT GCGTACCAGT CGCTTCGGAC TGAACACCAC CTCCGTCGAC 
CGATGA

Protein sequence

MIALEDLPPG GVGVTAGRRL PTSYLLWLAG ILASLLGNSL FYFALGWEAS AHGGAVAGLV 
LTAITLPRVL LLLIGGAVGD RVSARRVLII GDAVMLVFSV ALAASAYHLG APPWLLIAAG 
VAVGVADAFY LPASGSMPRR LVSQDQLSQA LALRQVGGQL VAMGGGPLGG VLVGLAGLAG 
AALVNAVTFA AVLTLLIIIR PRYNGPATAR SGGVVRDAVD SIRVGFRDPV LRPGLTLTGA 
AAGFLLPVLP LLVPLLARAE DWGAAAGGLI FGAQGVGMAI VTLAVVRRGP LGRPGLLAAC 
GLLIAGAGVA GLALSSTVGI AVGVGLIMGF GSGLFASHLG PLILGVTPDT HLSRIQALLT 
LVQSLASLIM VNVLGLIVDH RGAAVAILIC AAATSCVGLL GLRSAPLRTS RFGLNTTSVD 
R