Gene OSTLU_4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_4067
Symbol
ID	5000769
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	390496
End bp	391503
Gene Length	1008 bp
Protein Length	309 aa
Translation table
GC content	57%
IMG OID	640416190
Product	predicted protein
Protein accession	XP_001416642
Protein GI	145344235
COG category	[R] General function prediction only
COG ID	[COG1054] Predicted sulfurtransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.164519
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GCGACGGTGG ACGAGGACGC GCCGAAGTAC CAATTGATCA CGTTCTTTCG ATTCGCCGCG 
ATCGAGGACC CGGTGGCGGA GGTGGAGCGG CATCGCGCGC ACATCGAGCG ACGGGGCTGG 
GAACTGCGAG GACGGATATA CGTCAACGAG CAAGGCATTA ACGCACAGAT GTCTGGACGA 
GGGCGAGAGG GAGAGGAGTA CGCGCAATGG GTCGAGAGCG ACGCGCGATT CGCTGGGATG 
CGGATATCGG TGTATCCGAT GGATGCTCAG GCGCACCCGA GACTGGCGTT GCGATACAAA 
CCCAACTTGG TGCAACTCGA GGGAGGGACG AATCATTTAC CGTTGACCGA TCGAGAGAAG 
CGCGCGAAGC CGTTGTCGCC GAAGGAGTGG CACGATAATC TCATCAAGGT GAACTCGGGC 
GCGGAAGACG CGCCTTTGCT TTTGGATGTG AGAAACGGGT ACGAGTGGGA CGTCGGACAT 
TTTCGCGGCG CCGAGAGACC GGTGCAAGAG TCTTTCAGGG AAACCGTCTA TACGAACGTG 
CAAGACGGCT TAGGACCGCT GGCAAACGTG GATAAAGAAA AGCCGATCAT GATGTACTGC 
ACAGGTGGCA TCCGATGCGA CGTGTATTCT ACAGTATTGC GAGAGCAAGG GTACAAGAAC 
GTGATGACGC TCGAGGGCGG CGTGCAGGCG TACTTTGATG AGTACGGCAA GCGCGATGAT 
CAACTTTGGG ATAACCATTT GTTTGTGTTC GACAGTCGAC TCGCAATGGC CCCTGATGGA 
CGTCCGAGCG CCGAGCTAGG CGAAGCAGCG GCGACTTTGC GATGTTACTG CTGTGGCGAC 
AGTTCGGCGC CACCGCCGCA CCGCAACTGC CCCAACGTCG ATTGCAATAG GCTCTTCCTC 
GTGTGCAGTA AATGCACCGA TAAGCTCGAT GGATTTTGTT GCGAAGAATG CACGAAATCC 
GCGCACGTTC GACCGCAACT CGTCGTCCCT GGACGATATG AAAAGTAT

Protein sequence

ATVDEDAPKY QLITFFRFAA IEDPVAEVER HRAHIERRGW ELRGRIYVNE QGINAQMSGR 
GREGEEYAQW VESDARFAGM RISVYPMDAQ AHPRLALRYK PNLVQLEGGT NHLPLTDREK 
RAKPNGYEWD VGHFRGAERP VQESFRETVY TNVQDGLGPL ANVDKEKPIM MYCTGGIRCD 
VYSTVLREQG YKNVMTLEGG VQAYFDEYGK RDDQLWDNHL FVFDSRLAMA PDGRPSAELG 
EAAATLRCYC CGDSSAPPPH RNCPNVDCNR LFLVCSKCTD KLDGFCCEEC TKSAHVRPQL 
VVPGRYEKY