Gene OSTLU_2583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_2583
Symbol
ID	5004510
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	+
Start bp	412890
End bp	414290
Gene Length	1401 bp
Protein Length	453 aa
Translation table
GC content	56%
IMG OID	640419931
Product	predicted protein
Protein accession	XP_001420331
Protein GI	145351968
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.824744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0253902
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTCCCACCGT CGTTCGCGTT CGGCGTCGGA ACGTCGGCGT GGCAGATCGA AGGAAACGGT 
GGTGATCGCC CGCGATCGGT GTGGGACGCG TTCGTGAGCG AACTAGGAGA GGAGAAGAGA 
GTGGAGGCGG AGCGCGGGAT CGGCTTTCAC GAGCGATACG CGGCGGATGC GCAAATGATG 
GCGGATGCGG GAGTGAAACA TTTCAAAATG TCCCTGAGCT GGCCGAGGTT GATGCGCGCC 
GACGGGAGCG CGATCGATGA AGGGTTCGAG TATTATCAGA ACGTTTTCGG GGCGCTACGC 
GAGCGAGGCG TGGAACCGCA CGTGACGCTG TTTCACTGGG ACACGCCGAT GTGGTGCTGC 
GCCAACGAAA CGATCGCGAG CGGGCGTGGG AGCGTGTGCG AAGGAGCTTG GGTGAAGGAT 
GAAATCTTGA AAGATTTTGA GAAGTACGCG GATGCGGTGT TTAGTAGACT CGGGAAGGGG 
ATAAAATATT GGACCACAAT TAGTGAGCCA AAAACCGTCG CAGAGATGGG CTACGGTGCG 
GGCCTTCACG CGCCTGGGCG TCGGAGCGTG GAAGAACAAC TTAAAGTGGG GCATAATATG 
TTGCGTGCAC ACGCTTTGGC GGTGGCGCTC TATAGGGAGA AATATTCCCA GTTTGGAGGG 
AAACTTTCAA TCAATTTGAA TAGCGCTTGG GTCGAGCCGG CGTCGGATTC GCCGGACGAC 
GTGCGTGCGG CGGCAAACGC GATGGATGAA GAGCTTGGAT GGTTTGCCGA TCCTATTTAT 
AAAGGTGACT ATCCGGCGAG CATGCGGGCG AGATTGGGGA GCTTTCTTCC GGAGTTCACC 
GAGGAGGAGC GCGTGCTCGT GAAAGGGAGC GTCGATTACT TTGCGCTCAA TCACTACACG 
TCCTACTTCG CCAAGCATGT GACCGACGCG CAAGCTTCGT CGCAGCTTGG TTTGAGCGGC 
AGACCTCAGC CGTGGGAGAT CACACTAGAG TCAGAAAAGA GCAAGAAACC AATCGGCAAG 
GAGGCGCAAA GCGACTGGTT GCACATCGTG CCGTGGGGAT TAGAAAAGGT TTTGCTGCAC 
ATCAAGGACA GATACGACGA TCCAGCGATC ATGATCTCGG AGAATGGCGT CGATATCGCC 
GAGAGGGGCG ATATCGCGGA AACTCTGGAC GACACAACGA GAGTCAAGTT TATCGATGCC 
TATCTCGGAG CCGCTCGCGA GGCGATGCGT AAAGGCGCAA ACGTTGTGGG GTACTTTTAT 
TGGTCGATGT TCGACAACGT CGAGTGGGTG GATGGGCGAT CGAAACGATT TGGTTTGGTT 
TATGTCGATT ACGACGGCAA GTACGGCGAA AAGATGAAGC GCTATCCAAA GAAATCTCTC 
GAGCACTTCT CCTCCTACAT G

Protein sequence

FPPSFAFGVG TSAWQIEGNG GDRPRSVWDA FVSELGEEKR VEAERGIGFH ERYAADAQMM 
ADAGVKHFKM SLSWPRLMRA DGSAIDEGFE YYQNVFGALR ERGVEPHVTL FHWDTPIVCE 
GAWVKDEILK DFEKYADAVF SRLGKGIKYW TTISEPKTVA EMGYGAGLHA PGRRSVEEQL 
KVGHNMLRAH ALAVALYREK YSQFGGKLSI NLNSAWVEPA SDSPDDVRAA ANAMDEELGW 
FADPIYKGDY PASMRARLGS FLPEFTEEER VLVKGSVDYF ALNHYTSYFA KHVTDAQASS 
QLGLSGRPQP WEITLESEKS KKPIGKEAQS DWLHIVPWGL EKVLLHIKDR YDDPAIMISE 
NGVDIAERGD IAETLDDTTR VKFIDAYLGA AREAMRKGAN VVGYFYWSMF DNVEWVDGRS 
KRFGLVYVDY DGKYGEKMKR YPKKSLEHFS SYM