Gene OSTLU_3954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3954
Symbol
ID	5001175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	344598
End bp	345629
Gene Length	1032 bp
Protein Length	344 aa
Translation table
GC content	53%
IMG OID	640416596
Product	predicted protein
Protein accession	XP_001417481
Protein GI	145345991
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5533] Ubiquitin C-terminal hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	288
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AAGACGCTCG GCGACGCGTT CCCACCGTCG GCAAAGTTTT TTGGATTGGA AAACTTTGGC 
AACACGTGCT ACTGTAACTC GGTGCTCCAG GCGCTGTACG CGTGCGATGA GTTTCGAGAA 
CGATTGATCG AACATCACGC GGCGGCGAAC GATGGGACGT CGACGAGCGG ACGAGGAAAG 
GAGACGCCCG ACAGCATGCT GGCGGCGCTC GGGGATCTGT TTCGAGAGAT TTCGGGACAA 
ACGAAACGCA CGGGATACGT CAGCCCGAGG GCGTTCATCG AACGGTTGAG GAAGGATAAC 
GTGTTGTTTC GAGGACACAT GCATCAGGAT GCGCACGAGT TTTTAAACTT CTTGCTGAAT 
GAGTGTTGCG AAAATTTACA GACGAAGTTG AAGCGAGACG GCGCGTGGGA ACCGGGGAAG 
AAGACGTGGA TACACGATGT GTTCGAGGGG AAACTGGCGA ATCAGACGCG GTGTTTATGG 
TGTGAGAACA CGACGAATAG AGAGGAGTGC TTTTTGGACC TGTCGGTTGA TGTCGAGCAG 
AACACTTCCA TCACGGCGTG CTTGAATAAT TTCAGCGCCA AGGAGTTGTT GGACAAAAAC 
GACAAGTTTC AGTGCGATCG ATGCGGTGGG TTACACGAGG CGCAGAAGCG AATGCTGATT 
CATGAAGCGC CGAAAGTATT GTCGTTACAC TTGAAGCGGT TCAAGTACAT CGAGGCGCTC 
GGCAGGCACG CGAAACTGAA TCATCGCGTG GTGTTCCCTT CCGAATTGAA AATTCCCAAC 
TTGATAGACG AAGCGGAGAA TCCCGATGCG AGTTATAAGC TTTTCGCCGT CGTCGTTCAC 
ATCGGCTCCG GGCCTAATCA CGGACACTAC GTGTGTTTCG CCAAGAATAA TCATCGCTGG 
TTCTTGTACG ATGACGATTG CGTTGAAGTC GTGGATGAAG AGCAGCTTCA ACAAGTCTTT 
GGCTCGACGA CGGATGGCGG CTCCGCGGGG AGCGAGCACG GATACATTTT GTTCTACGCC 
CGATCTGAAG GT

Protein sequence

KTLGDAFPPS AKFFGLENFG NTCYCNSVLQ ALYACDEFRE RLIEHHAAAN DGTSTSGRGK 
ETPDSMLAAL GDLFREISGQ TKRTGYVSPR AFIERLRKDN VLFRGHMHQD AHEFLNFLLN 
ECCENLQTKL KRDGAWEPGK KTWIHDVFEG KLANQTRCLW CENTTNREEC FLDLSVDVEQ 
NTSITACLNN FSAKELLDKN DKFQCDRCGG LHEAQKRMLI HEAPKVLSLH LKRFKYIEAL 
GRHAKLNHRV VFPSELKIPN LIDEAENPDA SYKLFAVVVH IGSGPNHGHY VCFAKNNHRW 
FLYDDDCVEV VDEEQLQQVF GSTTDGGSAG SEHGYILFYA RSEG