Gene OSTLU_956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_956
Symbol
ID	5003488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	634774
End bp	636504
Gene Length	1731 bp
Protein Length	577 aa
Translation table
GC content	56%
IMG OID	640418909
Product	predicted protein
Protein accession	XP_001419443
Protein GI	145350064
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1501] Alpha-glucosidases, family 31 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00413725
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTCGGGTTGA ATCAGCTTGA TTTCGTCTAC GCCATGGACC CAGACGAGCG CGTGTACGGG 
CTGGGCGAGC AATTTTCTTC GTACAATCAT CGCGGGCGTC GAGTGCCCGT GATTACGGGC 
GAACAAGGCA TGGGTCGCGG AGTGCAACCT TTATCATTCA TGTTTAATTC CGTCTTTCCA 
GGGTCGGCTG GGTCCTGGCA CACGACATAC ACGGCGATTC CGCATTACAT CACGCACAAG 
GCGCGATCGG TGTTTCTGAC GAATTACACC TACAGCGAGT TTGATTTCAC CGAGGAAGAA 
AGTGTCGTTA TTCGCGCCGC GGCTCCGAGT GGATTGATCA CCGGACAAAT AATCGGTGGG 
TCTAGCATTC CTGACGTTTT ACGGGCGTAC ACTGATTATG CCGGACGCAT GACGTCGCTT 
CCGGAATGGG CGATGAACGG CGTCATTCTC GGCATGACGG GTGGTCCACA GAAAGTACGT 
CAAGTGTACA AAACATTGGG CGAAGGCGGT GTGAAAGTGG CTGGATTGTG GCTCCAAGAC 
TGGGGTGGCG TGCGCAACAC GTCTATCGGG ATTGAACGCG TGTGGTGGAA TTGGCGTCTC 
GACGAGACGC ACTACACGGA TTGGGACGCG CTGCGAGAGG AAATCAAACC AAACGGCACG 
CACCTTCTGA CATACGTCAA TACCTTCTTG ATGGATGCGA ATTCCGACAA AGGATTACTT 
TATAGAGAGG CGAAGGAGAA AAACTACATG GTACGCGATG TCAAGGGTGA AGTATATAGA 
CTCGGCTCGG AACCGGGCGT GACATTCGGT TTACTCGACT TGTCCAATCC CGAGTGCGTG 
GCGTGGATAG AGGATATCAT TGTCGACATG CTGGAAACGA CGGGCGCGAT GGGCTGGATG 
GCGGACTTTG GTGAATATCT CCCTTTCGAC GCGGTTTTGC ACTCAGGGGA GTTGCCCATC 
GAAGTGCATA ATCGTTATCC TGAGGATTGG GCAGAGGTGA ATCGACGAGC GATGCGGCGA 
GCCGGTCTCG AGGGCACAGG TTTCTTCTGG AGCCGCAGTG CGAGTACGAA GTCCCCGAAA 
CATTCCGCGC TTTTCTGGCT TGGCGATCAA ATGGTCTCAT GGGACGCGTA CGACGGCATC 
AAAACAGCCG TGCTCGGCGG ATTATCAGGC GGATTGTCCG GTCTTACGTT GACGCACAGC 
GACGTCGGAG GGTACACCGC CCACCCGCTC AAGCATCGTT CGGAAGAACT CCTGATGCGA 
TGGATGGAGC TGAACGCATT CGCCGACGCG ATTTTTCGCA CACACCAAGG TAATCGCCCG 
CATCACAACG CACAGCCATG GAACACGCCA GAGTTGGTGG AACATTTGAA GTTTTGCGTG 
GATATTCACG TCGCGCTCAA GCCGTACAAA GTCGAGCTCA TGCGAGAGGC CCAAGCCGTG 
GGGCTCCCCA TGACTCGTTC GATGATCATT CACTACCCAT ACGACACCAA CGCCGCCAAT 
ATCGCCACGC AATTCCTCCT CGGACGAGAC ATTCTCGTCG CCCCCGTGTT GGACAAAGGC 
GCCACGCACG TGCACGTTTA TCTTCCGCCC GGCGACGTGT GGGTCGACGC CTGGACGACG 
CAAAGAGCGC CCGTGCAGCC CGACCTCATC GGCTCTGACG AAGGTGGCCG AGGGTCGTGG 
ATCACTGTTG ACACTCCCAT GGGTTGGCCC GCCGCCTTCG TCCGCAAATC C

Protein sequence

VGLNQLDFVY AMDPDERVYG LGEQFSSYNH RGRRVPVITG EQGMGRGVQP LSFMFNSVFP 
GSAGSWHTTY TAIPHYITHK ARSVFLTNYT YSEFDFTEEE SVVIRAAAPS GLITGQIIGG 
SSIPDVLRAY TDYAGRMTSL PEWAMNGVIL GMTGGPQKVR QVYKTLGEGG VKVAGLWLQD 
WGGVRNTSIG IERVWWNWRL DETHYTDWDA LREEIKPNGT HLLTYVNTFL MDANSDKGLL 
YREAKEKNYM VRDVKGEVYR LGSEPGVTFG LLDLSNPECV AWIEDIIVDM LETTGAMGWM 
ADFGEYLPFD AVLHSGELPI EVHNRYPEDW AEVNRRAMRR AGLEGTGFFW SRSASTKSPK 
HSALFWLGDQ MVSWDAYDGI KTAVLGGLSG GLSGLTLTHS DVGGYTAHPL KHRSEELLMR 
WMELNAFADA IFRTHQGNRP HHNAQPWNTP ELVEHLKFCV DIHVALKPYK VELMREAQAV 
GLPMTRSMII HYPYDTNAAN IATQFLLGRD ILVAPVLDKG ATHVHVYLPP GDVWVDAWTT 
QRAPVQPDLI GSDEGGRGSW ITVDTPMGWP AAFVRKS