Gene OSTLU_41064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41064
Symbol
ID	5002513
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	-
Start bp	683838
End bp	685029
Gene Length	1192 bp
Protein Length	332 aa
Translation table
GC content	61%
IMG OID	640417934
Product	predicted protein
Protein accession	XP_001418547
Protein GI	145348207
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.854437
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACGC CGGCGCCGAG CGACGGCGCG ACCGCCGTCG CGCCGCGGGC GGCGCCCGCG 
AGCGCGAGCG AGGTCGTCGT GCACCCGCTC GTGCTGCTCA GCGTCGTCGA TCACTTTCGA 
CGATGCGACG AGGTGCGACG ACGACGACGA CGCGCGACGA CGACGACGAC GACGACGACG 
ACGACGCGGG ACGCGGGATC GCGCGCGCGC GACGCGGGAC GACGCGGGAC GACGCGGGAC 
GCGCGAGACG CGCGCGATCG CGGATCGCTT CCTTCGCGCG AGTTTTGACT GACTCCGACG 
GTTCGACGCG CAGGGCGACG AGGAGAACAA GCGCGTCGTC GGCGTGCTGC TCGGGGAACA 
GCGCAAGGGA CGGTTGGACG TCACGAGCTC GTTCGCGGTG CCGTTCGAGG AGGACGACGG 
GGATAACGGG ATTTGGTTTC TCGATCACAG TTACTTGGAA AACATGTATC GAATGTCGAA 
GAAGATTAGC GCGAAGGAGA AGATTGTGGG GTGGTACAGC ACCGGACCGA AACTGCGGGA 
GAGTGATATC GACATACACG AGTTGTTTTA CGCGTACACG CCCGAGCCGG TGCTCGTGAT 
CGTGGACGTG CGGGCGGAGA ACGCGAACAT TCCGACGAGC GCGTTCGCGG CGCAAATCGA 
AGTCAAGGAG GATGGAACGG AAAAGCAACA GAAGACGTTC GTGCACGTGC CGAACTCGAT 
TGAGGCGTTC GAGGCGGAAG AGATCGGGGT CGAGCACTTG CTGCGCGATG TGAAGGATAA 
CACGGTGTCG ACGCTGAGCA CCAAGGTGAG CGAAAAAGTG CAGTCTTTGC GCGGTTTGAA 
GGCGCGATTA GAAGAAATCA AGAGTTACAT GGATAAGGTT GTCGACGGCT CGTTGCCGAT 
GAATCACGAG ATCATGGGTC ATCTGCAAGA CGCGTTTAAC CTGTTGCCGA ACCTGAACTT 
GGAGGATTAC GTCAAGGGAT TCAACGTCTC CACGAACGAC GCCATGCTCG TCGTGTACCT 
CAGCTCGTTG ATTCGTTCAG TCATCGCTCT GCACGACTTG ATCAACAACA AGGCGACGAA 
CAAGGAACGC GAGCGCGCCC TGGATGCCCC GGGAGCGAGT GACGCGGAGA AGGATACGGA 
CAAGGAGAAC GAAAAACCGA AGGATTCGGG AAAGGCCGAC GCCGCAAAGT GA

Protein sequence

MSTPAPSDGA TAVAPRAAPA SASEVVVHPL VLLSVVDHFR RCDENKRVVG VLLGEQRKGR 
LDVTSSFAVP FEEDDGDNGI WFLDHSYLEN MYRMSKKISA KEKIVGWYST GPKLRESDID 
IHELFYAYTP EPVLVIVDVR AENANIPTSA FAAQIEVKED GTEKQQKTFV HVPNSIEAFE 
AEEIGVEHLL RDVKDNTVST LSTKVSEKVQ SLRGLKARLE EIKSYMDKVV DGSLPMNHEI 
MGHLQDAFNL LPNLNLEDYV KGFNVSTNDA MLVVYLSSLI RSVIALHDLI NNKATNKERE 
RALDAPGASD AEKDTDKENE KPKDSGKADA AK