Gene OSTLU_38574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38574
Symbol
ID	5002020
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	754792
End bp	755859
Gene Length	1068 bp
Protein Length	336 aa
Translation table
GC content	60%
IMG OID	640417441
Product	predicted protein
Protein accession	XP_001417862
Protein GI	145346783
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0398973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGAAAG ACTTTTACGA GACGCTGGGG GTGTCGCGCG CGGACGCGGA CGATCAGGAA 
AAATTGAAAA AGGCGTACAA GAAGGCGGCG CTGAAATCGC ACCCGGATCG ACCGGGAGGC 
GACGCCGAAA AGTTCAAGGC GGTGGGTTTG GCGTACGATG CGCTGAGCGA CGCGAACAAG 
CGGACGATAT ACGACCGATA CGGTGAGGAG GGGTTGAAGC AAGGGTTCGT GCCGCCGGAA 
GCGAGGGGCG AGGCGAGCGG TGCGAGCGCG GGTGGGTTTC CGGGAGGAGG ATTTTCGGGA 
AGCGCGCCCG GGAGTGGATT TCGCGCGTCG AGCGGCGGCG GCGGTTTCGG GTTCCCCGGC 
GGCGGCGGGT TTCATGAATT CACCGGTGCA GACGCGGAAG ATTTGTTCGC CAGGTTTTTC 
GGCGGTGGCG GCGGCGGCGG CGCGGGGTCA CCGTTTGGAG GAGGAATGGG CGACGCGTTC 
GGCGCGGGCG TGGGGAGCAA ACGACGTCGT CCCGAGTGCG TGTTGAATCT CGAGTGCACG 
CTCGAGGAGC TGTTTAGAGG CGGACGCCGG GACATCAACT ACGTTCGAAA CGTGCGTGCG 
GGAACGAGCG GTCAGATGGC TCAAAGTAAT GAGTGCATCT CGATCGATTT CAAACCCGGT 
TGGAAAACCG GCACGAAAAT TACATTTGCC GGAAAAGGGA ACGAAGACGC GCAAACCGGC 
GAAGCGGCGG ATCTGGTCGT GGTGATCAAG GAAACGCCGC ACAAATTCTT ACGACGAGAT 
GGAGATGACT TGGTGTACGA AGTTCCTCAA ATCTCACTTC GCAGCGCGTT GATTGGTTGG 
AAGGTTGAAT TCGTCAACGT AGACGGCGAG AAGGTGCGTC TATCGTTCGA CGATCCTACG 
GCTCCAGGAT CGGCGCGCGC GGTTCGAGGA AAAGGAATGC CGAATCAGAA GACCGGGCGG 
AGAGGCGACC TCATCGTCAC CGTAAAAACC GTCAAGTTTC CCTCGCATCT CAACTCGAAA 
CAAAAAACAT TGCTACGCGA AGCCTTCGCT CCAGGTGCCG CGGCGTGA

Protein sequence

MGKDFYETLG VSRADADDQE KLKKAYKKAA LKSHPDRPGG DAEKFKAVGL AYDALSDANK 
RTIYDRYGEE GLKQGFVPPE ARGEASGASA GGGGGGFGFP GGGGFHEFTG ADAEDLFARF 
FGGGGGGGAG SPFGGGMGDA FGAGVGSKRR RPECVLNLEC TLEELFRGGR RDINYVRNVR 
AGTSGQMAQS NECISIDFKP GWKTGTKITF AGKGNEDAQT GEAADLVVVI KETPHKFLRR 
DGDDLVYEVP QISLRSALIG WKVEFVNVDG EKVRLSFDDP TAPGSARAVR GKGMPNQKTG 
RRGDLIVTVK TVKFPSHLNS KQKTLLREAF APGAAA