Gene OSTLU_39993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_39993
Symbol
ID	4999679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009355
Strand	+
Start bp	554540
End bp	556606
Gene Length	2067 bp
Protein Length	688 aa
Translation table
GC content	53%
IMG OID	640415100
Product	predicted protein
Protein accession	XP_001415532
Protein GI	145340853
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5560] Ubiquitin C-terminal hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000426118
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGACA CGACTTTTGG ATGCGATGTG AGTTTGACGC CAAAGAACGA CGTGACGACT 
TGCGCTGAGG AGGCAAAAGT AGGAACGAGG GGCAAAGCCG GACTGAGCAA TCTCGGGAAT 
ACGTGCTTTA TGAATAGCGC ATTGCAGTGT CTCAGTCACT CTTCGCTTTT GACGGATTAC 
TTTCTGTCCG ATAAATACGA AGTGGACATT AATACGGACA ATCCCATCGG TATGGGCGGG 
GAGCTGGCGA AGGAGTACGC GAATTTGATA GGCGCACTTT GGCGGGACGG CGCGCTCACG 
GTCACGCCGC GCAAGTTCAA GTCTTCCTTG GCTCGTTTCG CGCCTCAGTT CAGTGGATAT 
ATGCAACAAG ATGCACAAGA GCTGTTGGCG TTTTTACTAG ATGGCTTGCA CGAAGATTTA 
AATCGCGTCA AGAACAAACC GTACGCCACA GAGCGAGACG CGGAGGGAAG AAGCGACGAG 
GACGTTGCAA ACGAATCTTG GGAAGCACAC ACGGCTCGCA ACAATTCTTG CATCGTCGAT 
ACTTTTCAGG GTCAGTATCG ATCGAAGTTG GTTTGCCCGT CATGCAGCAA CAAATCGGTC 
AAGTTCGATC CGTTCATGTA CCTTTCCATT CCGGTCCCGT CGGCTCGTGA GCGCATGATT 
AAAGTCACAC TCGTATCGTA CGGCGACGAA CTTTCTGCAA TCACGTACGG TTTGAAACTG 
CCTAAGAATG GTGAGATTGC CATGTTACTT AGTGCTCTAT GCGAAGCCGC TGATATCGAT 
ACGATGGACG AACGTGTGGT ACTTTGCGAA GTGTACAATC ATCGAATGGA AAAGACTCTT 
TCGAACATGT CCTACTCACT CACAGACATC AGAGAACGCG ACGTGATATA CGCGCACCGC 
TTACCGGCGA TAAAAGACAA CGACAACGTG GAAACAGTCG ACACCGTTCT TGTGCACAGA 
AAAGAGTTGA ATCAAAACAA GACGCCGTAT TCGCACGTTA GCTCCGTGGC GGCGACGACG 
ATGGTCCGAT TTGGCTTTCC GTGGATCGTT CCAGTGAGCG TGCCAAAAGG CACGAAGGCT 
GGTCCCGACC ACGCGAGATT CGTAGAGAAG GAGGTGGAAA AGTTTAGCGC AAAGTTTGCA 
CACACAAATT CGATGGAGAA ATCGTGTTCG CCTACCACGA GCGGCGATAC AGAAGGAAGT 
GCGTCTCGAC GCGCCGTCGC AGAAAAGGAC TCTCGACTCT TCAAAATGAA GTACACGAAT 
AAGAGCGCCT CGGCATCGTT CCACGAGTAT GGTTCAACGA CCGCATCGAC GTCGGACTCG 
CACGAAATGC AGTACACCAT CGCCTCCTCC ATGCATTGCG TTGCGATAGA CTGGTCTTCG 
AAGGCTCTGA GCCAGTTCTT TGACGAAGAA TTGTTGGAGC GTGAAATCGA GGAGCACCCA 
AGCGTGACGG AGAACGCGAT TGAGAACAGC GGGACTCAAG GCACACCACT AGCGTCGTGC 
ATCGAGTCTT TCATTCAAGA AGAGCCGCTC GGTAAGGATG ACATGTGGTA TTGCAAGCAG 
TGCAAGGACC ACGTCCAGGC GATGAAAAAG CTCGATTTGT GGCGCATGCC GCCGATTCTC 
GTCATGCACC TCAAGCGTTT CAGCTACAGT CGAACGTGGC GAGATAAGAT CGATACGTTG 
ATTGATTTTC CACTCAACAC GCTTGACATG ACGCCTTACG TACTCCCGAA CGCTTCCAGT 
GGGCCGGCGC CGATTTATGA CTTGTACGCG GTGGTGAACC ACTTTGGCGG CATGGGCGGC 
GGTCATTACA CCGCGTACAC GAGACACGCC GAGGAGGGCA CGTGGCACTT GTACGACGAT 
AGTCGTTGTA CCGCAGTAGA CGTCGGTGCG GCGCTGAACA ACAGCGCGGC TTACGTCTTG 
TTCTACAAGC GCCGCGACGT CCCGATGCGC CAAGCCATGT CTCGCGCCGG CTCGCTGTGC 
AACATGGCCG CCATGGACAG CGTCGCGAAC ACGCGTACCC CATGCGACGA CGACGACGAC 
GAACCTAGAG AAATGGAACT CAACTAG

Protein sequence

MEDTTFGCDV SLTPKNDVTT CAEEAKVGTR GKAGLSNLGN TCFMNSALQC LSHSSLLTDY 
FLSDKYEVDI NTDNPIGMGG ELAKEYANLI GALWRDGALT VTPRKFKSSL ARFAPQFSGY 
MQQDAQELLA FLLDGLHEDL NRVKNKPYAT ERDAEGRSDE DVANESWEAH TARNNSCIVD 
TFQGQYRSKL VCPSCSNKSV KFDPFMYLSI PVPSARERMI KVTLVSYGDE LSAITYGLKL 
PKNGEIAMLL SALCEAADID TMDERVVLCE VYNHRMEKTL SNMSYSLTDI RERDVIYAHR 
LPAIKDNDNV ETVDTVLVHR KELNQNKTPY SHVSSVAATT MVRFGFPWIV PVSVPKGTKA 
GPDHARFVEK EVEKFSAKFA HTNSMEKSCS PTTSGDTEGS ASRRAVAEKD SRLFKMKYTN 
KSASASFHEY GSTTASTSDS HEMQYTIASS MHCVAIDWSS KALSQFFDEE LLEREIEEHP 
SVTENAIENS GTQGTPLASC IESFIQEEPL GKDDMWYCKQ CKDHVQAMKK LDLWRMPPIL 
VMHLKRFSYS RTWRDKIDTL IDFPLNTLDM TPYVLPNASS GPAPIYDLYA VVNHFGGMGG 
GHYTAYTRHA EEGTWHLYDD SRCTAVDVGA ALNNSAAYVL FYKRRDVPMR QAMSRAGSLC 
NMAAMDSVAN TRTPCDDDDD EPREMELN