Gene OSTLU_39789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_39789
Symbol
ID	4999955
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009355
Strand	+
Start bp	913186
End bp	914186
Gene Length	1001 bp
Protein Length	301 aa
Translation table
GC content	63%
IMG OID	640415376
Product	predicted protein
Protein accession	XP_001415636
Protein GI	145341065
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0676] Uncharacterized enzymes related to aldose 1-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCTT CGTTTGCCAC CGTCCAACCG AGCGTCCGCG CGCGCGCGAC GCTCCGATCC 
CGCGCGAGAC GCGCCGATCG ATCGTCGATC GTCGTCCGCG CGGGCAGCGC GGCGCAACAA 
AAAGGTCTCG GCGATCTCGA CACCGTCAAG CTCACCGCCG CCGACGGTTC CACCGCGGAC 
GTGTACTTGT TCGGCGGCGT CGTGACGAGT TTCAAGCCCA AGGGCGGTGA CGACGTGCTG 
TACGTGCGCC CGGATGCGAA GTTTGACAAG GTGCGTCGGC GGCGAAGCGA CGCGCGAGAC 
GCGCTCGGAC GATGAGCGAA GCGATGGAAG ACTGACTGCG GTGTGGTAAA CACAATCGCA 
CGTAGAGTAA GCCGATTTCT GGTGGTTTGC CGCACTGCTG GCCGCAGTTC GGCCCGGGGG 
CGATTCAAGT GCACGGATTC GCGCGCAACG TCGACTGGAC GCTCGTGAGC ACGACGGATG 
GCGACGAACC GTCGATGACG ATGGAACTCA CGCCAAATGA TTACACCAAG GCGATGTGGG 
ATAAGGATTT CAAGGTGACG GAAACCGTCA CGCTCAAGGG CGGCGCGCTC GAGGCGAAGC 
TCGTGGTTGA GAACAAGGGC AAGGAAGCGT TCGATTTCAC TGGTTCGTTC CACACGTACT 
TGAGCGCCGA CATCAACGCC GCCGCCGTCG GCGGGTTGAA CGGCTGCAAG ACGTTAGATC 
GACTCGCGGA GAAGGAATCC ACCGTCTCTG GTGACGTCAA ATTCCAAGGA CCGATCGACA 
GCGTGTACTA CGGCGTTCCG GAGACGCTTA CGCTCGCCAC GGGCAAGCGC ACTGTGAGCA 
TCAAGTCGAG CAAGACGTGG ACAGAAGCCG TGGTGTGGAC GCCGTGGACG GACATGGAGG 
CGTGCTACAA GGAGTTCGCG TGCGTCGAAA GCGCCGCCGT GACTCCGGTC GTCGTCGCTC 
CGGGCGGCTC TTGGACCGCC ACCACGACGA TTTCCGCGTA A

Protein sequence

MSASFATVQP SVRARATLRS RARRADRSSI VVRAGSAAQQ KGLGDLDTVK LTAADGSTAD 
VYLFGGVVTS FKPKGGDDVL YVRPDAKFDK SKPISGGLPH CWPQFGPGAI QVHGFARNVD 
WTLVSTTDGD EPSMTMELTP NDYTKAMWDK DFKVTETVTL KGGALEAKLV VENKGKEAFD 
FTGSFHTYLS ADINAAAVGG LNGCKTLDRL AEKESTVSGD VKFQGPIDSV YYGVPETLTL 
ATGKRTVSIK SSKTWTEAVV WTPWTDMEAC YKEFACVESA AVTPVVVAPG GSWTATTTIS 
A