Gene OSTLU_49086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_49086
Symbol
ID	5000958
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	174897
End bp	176462
Gene Length	1566 bp
Protein Length	506 aa
Translation table
GC content	61%
IMG OID	640416379
Product	MFS family transporter: sugar (sialic acid)
Protein accession	XP_001416575
Protein GI	145344098
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0133076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCGCG CGAGAGGGGG ACGCGGGGAG GAGGCGCGAG AACGCGGCGA CGTCGCGGCG 
CGCGCGAGAG CCGAACGACG CGATCGACGG GACGCGGTCG CGGCGAGCGG GAGCTCGAAG 
ACGACGCGCG AGGATCGGGA CGAGGGCGAG GAGGATCCGG ACGAGGCGTG GGCGTTTGAG 
TTTCCGAAGT CGGCGAGCGA CGTCACGACG CTCTGGCGAG GCGCGCCGAG TCGGTATCGC 
GTGCTCTTCG TCACGGTGTT CGCGTTCATC GTGTGTAACA TGGATAAGGT GAATATTTCG 
GTGGCGATCA TTCCCATGGC GCGGGAGTTC GGGTGGACGA GCACGCAGGC GGGGTTCGTG 
CAGAGCGCGT TTTTTTACGG TTTCGCGGCG TCGCAGTTAC CGGGCGGGTA CTTGTCGACG 
AAATTCGGTG GTGCCAAGGT GTTGCCGATC GGGATGTTGA TTTTGTCGTT GGCGACGATC 
GCGATTCCGA TCGTCGGCGT GAACGAGCAG AGCATTTTCC TGTCGCGCGT GCTCGTGGGT 
TTGGGCGAAG GCGTGGCGCC GAGCGCGGCG ACGGATATCA TCGCGAGAAG CGTCAGCGTG 
GGCGAGCGTT CGCGCGCCGT CGGGTTCGTG TTCAGTGGGT TCAACATAGG TTCGGTGCTT 
GGTTTGGGGG TGGCGCCACT ATTGATAGAG GCGACGAATT GGAGGACGGT GTTCGCATTC 
TTCGGCTCGT GCGGTTTAGT TTGGAGTTTT TGGGCTTGGA AGCTGTACGG CGACGGCGGG 
ATGGTTGACG AAAGTTACAA GGACGACGGC GTCACGGGTT TGACGGGTAA GCGCATATTC 
ACCGTCGACG CAAAGGCGAT AGCGAGCGGG AAGAGCCCGG CGGAAGACCC TCCGGTGCCG 
TGGGGGGAGT TTATATCGAA TCCGTCGGTG CGCGCGCTCA TGTACGTGCA CTTTTGCAAC 
AACTGGGGCT TCTACGTCCT ACTCGCTTGG CTTCCGACGT ACTTTACCGA CGAGCTCGGG 
GTGACACTGA CGAACGCATC GCTGTTGACT CTGCTTCCGC CGCTCGCGAA CGTCGCGATG 
GCGTCCGTCG CCGGTCCGAC TGCGGACCGC CTCATCGGCA GCGGCATGGA GATCACGAAG 
GTGCGTAAAA CGATGCAAGC AGTCGCCTTC ATGGGACCGG CGCTCGCCAT GGGCTCGGCC 
GCATTGGTAG ATCAGCCGGT GGCGACCGTG GGTCTGCTCA CGCTCGGCCT TTCGCTAGGC 
GCGTTTTCGT ACGCGGGTTT GTACTCAAAC CATCAAGATT TGTCGCCCAA GTACGCGAGT 
ATCCTGTTGG GCATGACAAA CACGTGCGGC GCGCTTCCGG GCGTCATCGG CGTTCCGTTG 
ACTGGGTACT TGATCAAAGA AACGGAAAAT TGGGAGCTTA GCATGTTCGT TCCGGCGATG 
TTCTTCTACT TTACGGGAAC GCTCGTATTC AGCAAGTACG GCAGCGGCGA TCGACAAGCG 
TTCACGGGAC AACCTATGCC CGAACCAGGC GAGATTCCGC CATCGTGCGA TGGCGGCGGA 
CATTAA

Protein sequence

MGRARGGRGE EARERGDVAA RARAERRDRR DAVAASGSSK TTREDRDEGE EDPDEAWAFE 
FPKSASDVTT LWRGAPSRYR VLFVTVFAFI VCNMDKVNIS VAIIPMAREF GWTSTQAGFV 
QSAFFYGFAA SQLPGGYLST KFGGAKVLPI GMLILSLATI AIPIVGVNEQ SIFLSRVLVG 
LGEGVAPSAA TDIIARSVSV GERSRAVGFV FSGFNIGSVL GLGVAPLLIE ATNWRTVFAF 
FGSCGLVWSF WAWKLYGDGG MVDESYKDDG AIASGKSPAE DPPVPWGEFI SNPSVRALMY 
VHFCNNWGFY VLLAWLPTYF TDELGVTLTN ASLLTLLPPL ANVAMASVAG PTADRLIGSG 
MEITKVRKTM QAVAFMGPAL AMGSAALVDQ PVATVGLLTL GLSLGAFSYA GLYSNHQDLS 
PKYASILLGM TNTCGALPGV IGVPLTGYLI KETENWELSM FVPAMFFYFT GTLVFSKYGS 
GDRQAFTGQP MPEPGEIPPS CDGGGH