Gene OSTLU_1794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_1794
Symbol
ID	5006094
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	+
Start bp	381266
End bp	382558
Gene Length	1293 bp
Protein Length	421 aa
Translation table
GC content	62%
IMG OID	640421515
Product	predicted protein
Protein accession	XP_001421924
Protein GI	145355346
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00327182
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

CCGTTTACGA CGTTCGACGA GGCGGCGTTT CCGAAACCGC TGCGAGCGGC GCTGAAAGCG 
CAGGGATACG ACGCGCCGAC GCCGATTCAG GCGGAAGCGT GGCCGATATT GCTGAAGGGG 
AAGGATGTGG TGGCGATCGC GAAGACGGGG TCGGGGAAGA CGTGTGGGTT TTTGTTGCCG 
GCGCTGGCGA GCATCGTGGC GAGAGGATCG CAAAAGGCGC CGGAGATGCA GTTGCTCGAT 
GGACGATGGC GTCCGGGGGC GGTGACGCCG ACGGTCATCG TGTTAGCGCC AACGCGGGAG 
TTGGCGATTC AAATCCACGA CGAGTGCGCG AAGTTTTGCC CCGCCGCGGG GTGCCGCTCG 
GCGGTGCTCT ACGGCGGCGC CGCCAAGGGC GATCAGTTGC GCGCGTTGCG TTCGGGCGCC 
GACGTCGTCG TCGCCACGCC CGGGCGATTG AACGATTTTC TTGAACCACC CCCGGGATTC 
ACCGCGCCCG TGAGCGCGGT GAAGGCGTCG TACGTCGTCC TCGACGAGGC GGATCGAATG 
TTGGACATGG GATTTGAGCC GCAGATTAAA AAGATTTTCA AGCTCTGCCC GTCGGCGCGT 
CAGACGGTGA TGTTCACCGC GACGTGGCCG AAAGCGGTGC AAAAGATTGC AGACTCTTTC 
ACGACGAAGC CGATTCACAT TCAAATCGGT AGCGGCGGCG ATAAACTCAC GGCGAATAAG 
TCGATTACGC AAACCGTCGA AGTACTCGAG GAGGAGGAAA AGTTTGACCG TTGCGTCGCC 
ATCCTGAAGA AGGAGCTCGG TAAGGACGAC ACGTGCATTA TGTTTGCCGG CACAAAGCGT 
CGATGCGATT TTTTGGACCG CAGATTGAAG CAGTCTGGGT TTTCCTCCGC CGGCGCTATT 
CACGGCGACA AGGACCAATA CGAGCGCGAG ATGGTCCTCG ACAACTTTCG TCGCGGTCGT 
GGCAATATTC TCGTCGCCAC TGACGTCGCT GCGCGTGGTT TAGACATTCC TGGCGTCGCA 
GCGGTTCTCG TGTACGATTT TCCGCTCCAA GTGGAGGATT ACGTGCACAG AATCGGTCGC 
ACCGGACGCG CCGGGAAGGA GGGCAAGGCG TTCACCTTCT TCACTAAAGA TAACCGTGGC 
GCCGCAAACG AGCTCATCGA TATCCTCCAA GGAGCCGGAC AAACCGTACC TTTGGCGCTC 
CAAGCGATGC AGCGCAAGGG CGGCGGCGGC GGAGGCGGCC GCGGTTGGTC GGGCGGCCGA 
GGCCGAGGCG GCGGCCGAGG CCGAGGCGGC GGT

Protein sequence

PFTTFDEAAF PKPLRAALKA QGYDAPTPIQ AEAWPILLKG KDVVAIAKTG SGKTCGFLLP 
ALASIMQLLD GRWRPGAVTP TVIVLAPTRE LAIQIHDECA KFCPAAGCRS AVLYGGAAKG 
DQLRALRSGA DVVVATPGRL NDFLEPPPGF TAPVSAVKAS YVVLDEADRM LDMGFEPQIK 
KIFKLCPSAR QTVMFTATWP KAVQKIADSF TTKPIHIQIG SGGDKLTANK SITQTVEVLE 
EEEKFDRCVA ILKKELGKDD TCIMFAGTKR RCDFLDRRLK QSGFSSAGAI HGDKDQYERE 
MVLDNFRRGR GNILVATDVA ARGLDIPGVA AVLVYDFPLQ VEDYVHRIGR TGRAGKEGKA 
FTFFTKDNRG AANELIDILQ GAGQTVPLAL QAMQRKGGGG GGGRGWSGGR GRGGGRGRGG 
G