Gene Strop_0197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0197
Symbol
ID	5056633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	228612
End bp	229682
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	70%
IMG OID	640472467
Product	hypothetical protein
Protein accession	YP_001157060
Protein GI	145592763
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCGGGT ATCTTGCTTT GGCCGCGATC TGGGGTTCCA GCTTTCTCTT CATCAAGATC 
GGGGTGCGGG AGCTACATCC CCTGCACCTG ACCCTCTACC GGGTCGGGGC CGGCGCGTTA 
ACGCTGCTGA TACTGCTCGT GGCGCTGCGC GACCGACTGC CCCGCGAGCC GCGGGTCTGG 
GCCCATCTGG TCGTCACCGG TGGGATCGGC GTGGCGCTTC CGTTCACCCT GTTCGGCTAC 
GGCGGGGAGC GGGTCGAGTC CATGCTCTCC GGGATCTGGA ACGCCACCAC ACCGCTGGTC 
GTGCTGCCCA TGGCGGTGCT GGTCTTCCGT ACCGAACGGA TTACCGCCGC CCGGGCGGTC 
GGGCTCGGGC TGGGCTTTCT CGGCGTACTG GTGGTGCTCG GGGTGTGGCA GGGCGCTGGT 
GGTTCGCACT TCGTCGGCCA GCTCATGTGC TTCGGCGCCG CGGCCTGCTA CGGGGTGGTC 
ATCCCGTACC AGAAGAAGTT CGTCGCGGGC CGCTCCTACT CCGGGCTGGC CCTGTCGGCG 
GCGCAGTTGC TGATGGCGCT GGCGCTGCTC ACCATCGTCA CTCCGTTCGT GGCGGGCGTA 
CCGCCGATGC CGACCGCCCT CTCCGGCTCG GTCCTGGCCA GCATGGTCGC GCTCGGCGCG 
CTCGGCACCG GGTTGGCCTT CCTGATTCAC TTTCGCAATA TCCGGGTCGC TGGCGCCAGT 
ACCGCAGCGA CGGTGACCTA CGTGATCCCG GTCTTCGCGG TGCTGGCCGG TGCGCTGGTG 
CTCGACGAGC GGCTGACCTG GCACCAACCG GTTGGCGCGG TGGTGGTCCT GCTCGGTGTC 
GCGGTCACCC AGGGGCTGAT CGGTCCCCGC CGCCGACCGC GGGCCGTCGC GCTACCGACC 
TCGGCAGCCG GCACCTCCGC CTCGGCGGCG GGAGTGCCGG CCACCGCCGA TCAGGAGCTG 
CTCCCAGCCC ACGCCACCAG CCGCTCCGCC GGCCAGGCAT TGACCACCCG ATCGGCAGGG 
ACGCCGCAGC GGGCGGCGCG TTCGCAGCCG AACCGTTGCC AGTCGAGCTG A

Protein sequence

MPGYLALAAI WGSSFLFIKI GVRELHPLHL TLYRVGAGAL TLLILLVALR DRLPREPRVW 
AHLVVTGGIG VALPFTLFGY GGERVESMLS GIWNATTPLV VLPMAVLVFR TERITAARAV 
GLGLGFLGVL VVLGVWQGAG GSHFVGQLMC FGAAACYGVV IPYQKKFVAG RSYSGLALSA 
AQLLMALALL TIVTPFVAGV PPMPTALSGS VLASMVALGA LGTGLAFLIH FRNIRVAGAS 
TAATVTYVIP VFAVLAGALV LDERLTWHQP VGAVVVLLGV AVTQGLIGPR RRPRAVALPT 
SAAGTSASAA GVPATADQEL LPAHATSRSA GQALTTRSAG TPQRAARSQP NRCQSS