Gene OSTLU_33387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33387
Symbol
ID	5003593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	135099
End bp	136256
Gene Length	1158 bp
Protein Length	385 aa
Translation table
GC content	61%
IMG OID	640419014
Product	BASS family transporter: sodium ion/bile acid
Protein accession	XP_001419499
Protein GI	145350192
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.307134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCGCG GGCGTTCGGT GTCGACACCG CGCGAAGGCC GACACCGAAG ACGCGTCGAC 
GCGCGCTCGA GGGCGAGCGA GGACGATCCG GACGGCGAGG ACGATACCTC GGACGCGCGC 
GGGAGCGACG ACGGCGTTCG GGCGGTGAAG GCGTGGTTGC GAGAGAACTT TTTCTTCGCG 
GGCGTGGGGG CGGCGGCGTG CGCGAGCGCG TCGCCAGAGT TTCGCGACGT CGTGGAGTCG 
TTCGGTGGTG CGGCGGGAGG GTCGTGGGGG TCGGGAGGGT TGGAAAAGTA TGCCATCGCA 
GCCTTATTCT TCATCGCGGG CGTTGGATTA CCGGTGAGAG CGTTGAAGGA AGCCGCGAGC 
GACGTGTCGC TCAACGCGTT TACGCAGGCG TTCATCTTCG TCTTTCCGAC GATCGTCATA 
GCCGCAGCCG CGCCGGTTTT GATTGAATCG GGGTGGTTGA GCGAGAACGT GGTCGATGGT 
TTATTCGTGT TGGCGTGCTT GCCCACGACA GTAGGTTCCG GCGTGGCGTT CACGCGGTCG 
GCGAACGGGA ACGTCGAAGC CGCCTTGCTG AATTCCATGG CGGCGAACCT CGCGGGTATT 
TTCTTGACCC CTGCGTTGAT ACATTTCTAT CTCGGCGCCG ACAGCTCGGT GGATCCGATC 
GCATCGAGTT CGAAGCTGCT CGTTCAAGCA TTTTTACCCG TCGCTCTCGG TATGAGCTTG 
CGTTTGATCC CGGGCGTGGC GTCCGCCGCC GAGGGCGGCT TGAAGGAGCC GAGCAAACTG 
CTCGGCGATG CCATTTTGCT CGCCATCATC GCCAAAACCT TCGTCACAGC GGAACAAAGC 
GAGGCGGGGA TGTTAGATTT CAACTCAAGC GCACACTTAG TGAGCGTCTT GTTGGTGTTC 
ATGCTCTTGC ACAAGGGATC GATTTTTTTG GCGGCGTCTC GCGTCGGCGC CTTCTCGCGC 
GAGGACGTCG TCTGCGCCCT ATACATGGGT TCGCACAAAA CCTTAGCGTT CGGCTTGCCT 
TTGATATCGA CCACGTTCGA GGGCGATCCC AATCTCGCGT CTTATGTGCT TCCCTTGGTG 
ATTTACCACC CCCTTCAAAT ATTCGCGAGC TCGCTCCTCG CGCGCCCTCT GGCGCGGTAC 
GAGAAGCGGC GCGAATGA

Protein sequence

MRRGRSVSTP REGRHRRRVD ARSRASEDDP DGEDDTSDAR GSDDGVRAVK AWLRENFFFA 
GVGAAACASA SPEFRDVVES FGGAAGGSWG SGGLEKYAIA ALFFIAGVGL PVRALKEAAS 
DVSLNAFTQA FIFVFPTIVI AAAAPVLIES GWLSENVVDG LFVLACLPTT VGSGVAFTRS 
ANGNVEAALL NSMAANLAGI FLTPALIHFY LGADSSVDPI ASSSKLLVQA FLPVALGMSL 
RLIPGVASAA EGGLKEPSKL LGDAILLAII AKTFVTAEQS EAGMLDFNSS AHLVSVLLVF 
MLLHKGSIFL AASRVGAFSR EDVVCALYMG SHKTLAFGLP LISTTFEGDP NLASYVLPLV 
IYHPLQIFAS SLLARPLARY EKRRE