Gene OSTLU_2484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_2484
Symbol
ID	5001810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	437438
End bp	438766
Gene Length	1329 bp
Protein Length	443 aa
Translation table
GC content	53%
IMG OID	640417231
Product	predicted protein
Protein accession	XP_001417770
Protein GI	145346592
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4232] Thiol:disulfide interchange protein
TIGRFAM ID	[TIGR01126] protein disulfide-isomerase domain [TIGR01130] protein disulfide isomerases, eukaryotic

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.632802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GAAGCGCCGA CGGATGATCA CGTGTTGAAG CTCGATGCGA GCATCTTCGA CAACGAGTTG 
AAAAAGTCGA AATATAACTT CGTGATGTTT TACGCGCCGT GGGATGGGCA CTCAAAGGCG 
TTCATGCCGC GTTGGATGTC TTACGCGCAG TCGCATAAAA TGGCGGGCAC GGAGATGACG 
TTTTCGCTCG TGGACGCGAC CAAGGAACGC GATTTGGATA AGCGATTCGA AATCGAGGAA 
TACCCGACGC TCATATTGTT CCGTGATGGT GTGCCGAAGA GGTACGTGGG CGATCGATCG 
CCGCAACACT TGGATAAGTT TGTTCGAAGA AACTTGCTCA AGCCGGCGCG TTGGCTGGAA 
GGCACGGACG ACGTCGAAGT TTTCTTGATG GGTCGCGACG TCACCGTTAT CGGGTTCTTC 
GATAACAAGG ATGATTTGGA CGTGTACCAC CACGCCGCGG CTGAGTTTGA TCTCGACTTT 
GGCGAGACGA AGAGCAAAAT CGCCACTGAA GACTGGAAAG CGCCGTTCCC GACCATCAAG 
ATGTGGCGCG ACTTTGACAA AGAACCCGTT AGGTACCCCG GCGACGTGCG CGATTTGGAT 
GCTATCAAGT CCTGGATCGC CACTGAAATG GTCCCACCGA TCGTGAAGTT CGAAAACAAG 
AAGCAACTCG AGCGCCTTTT CATGGGTCCG ATCGCTGCGA ACATCTTCGT ATTCTTACCC 
GAAGACGCGA CCGAAGCCGA GAAGATGTCG AAATCTTTAG AAAGTGCGGC CAGACAACTT 
CGTGGTAAGG TGCACATCAT CACCGTCGAT GCCAAAGAAA CTGTCATGCA TGACTACTTC 
TCTCTCCGCG AGAGCGACGG GCCGACGATT CGCCTTCTCT CGCATGACTT GAAGTATCAA 
TACAAGGGCT CATTGGAGGC CGCCGAGATC TCAAACGATG TCGTGCACTT TTTCAAGGAA 
TTCGAGGCGA AAAAGCTCGT GCCGTTGCTC AAGTCGCAAG ATCCGCTCCC CAAGGACGGT 
GACGTTCTGC AAGTTGTCGG TAAGACGTTC CAGTCGTTGC TCATGGATAA CGACAAGCAC 
GTCTTTGTTT GGTTCTACGC GCCGTGGTGC CGCACGTGCA AGGCGATGAA GCCGGTGTGG 
GATAAGCTCG CCACGCTTTA CAAGGATGAG AAAGACATCA TCATCGCCAA GATGGATGCG 
ACGAAGAACG AGGCGAAGGA TTTGCACGTT CGACACTATC CGACCGTGTA CTACTATCAT 
TCCGGTGATA AGCCCAGACA CGAGGAATAC GACGGACACA TGGAAACGGA TGCGTTCACC 
GATTTCCTC

Protein sequence

EAPTDDHVLK LDASIFDNEL KKSKYNFVMF YAPWDGHSKA FMPRWMSYAQ SHKMAGTEMT 
FSLVDATKER DLDKRFEIEE YPTLILFRDG VPKRYVGDRS PQHLDKFVRR NLLKPARWLE 
GTDDVEVFLM GRDVTVIGFF DNKDDLDVYH HAAAEFDLDF GETKSKIATE DWKAPFPTIK 
MWRDFDKEPV RYPGDVRDLD AIKSWIATEM VPPIVKFENK KQLERLFMGP IAANIFVFLP 
EDATEAEKMS KSLESAARQL RGKVHIITVD AKETVMHDYF SLRESDGPTI RLLSHDLKYQ 
YKGSLEAAEI SNDVVHFFKE FEAKKLVPLL KSQDPLPKDG DVLQVVGKTF QSLLMDNDKH 
VFVWFYAPWC RTCKAMKPVW DKLATLYKDE KDIIIAKMDA TKNEAKDLHV RHYPTVYYYH 
SGDKPRHEEY DGHMETDAFT DFL