Gene OSTLU_37673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37673
Symbol	PGE3501
ID	5006015
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	-
Start bp	104265
End bp	105482
Gene Length	1218 bp
Protein Length	391 aa
Translation table
GC content	64%
IMG OID	640421436
Product	predicted protein
Protein accession	XP_001421975
Protein GI	145355452
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0842145
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGCG CGCGGGAGGC GAAACGGGCG TCGTACGCGC CGACGTGCGC GATACGGGAC 
GGTCAGGAGC GCGCGCACGT GTACTGCGCG CGATTTTGCG CCATCGAAGG CGTCGATGGA 
AAGTTTCAGC GAACGTTCGC CACGTGCGCG GGGACGCGGG CGGACGTGTG GGAGTGCGAA 
AAGTCGGGAA ACGTCGTGCT CGTGGCGTCG TTTGAGACGC GCGACGCGAA TGAGGCGTTT 
TACGCGTGCG AGTGGTGCGC GATTGACTCG GTGGGACGAC GGGAGAGCGG CGCCGACGCG 
ACGACGACGG GAAAGGGGAA ATTGCGGCCG TGCCTGGCGC TCGCGGGGGA GGGAGCGGTG 
GTGCGCGTCG TAGATTGCGT CACGGGGCGG CTGCACGTGA ATCTGGTGGG ACACGGAGGG 
ACGGTGAATT CCGTCGTGTC GCACCCGTCG CGGCCGAGCG TGGTGGCGAC GGCGAGCAAG 
GATTTGAGCG TTCGTCTGTG GCACGTCAAC ACCGGGGTGA CGATGGCGAT ATTAGCCGGG 
GCTCGAGGCC ATAGAAATGA GTTGTTGAGC GTGGATTTTC ATCCCGCCAT CGACGCGAAA 
GGGCAGATGA AGCTCGTCAC GGGCGCGATG GACAACTGCG TCAAGGTTTG GGCCACGCCG 
CCGCTCGCGG ATTCCATGGC GAAGGCGGCG ACTTGGACGA AACCACTCGC GAATTTCAAA 
ACGATCGTCA TCGATACGCC GATGTTTTCG AGCAGCAGCG TGCACGACGA TTACGTCGAT 
TGTGTCGGGT GGTTGGGCGA CGCGGTGTTG AGCAAGAGCG TGGACGGCAT CGTGAAGCTT 
TGGGTGCCAG ACGAACCCGT GGGCGTGGTG CACGCGCGAG GGAACCAATT TCGTTCGGTG 
TCGGCGTTTG AGCAAAAAGA CGCGAATTTG TGGTGGATAC GCTTCGCCGT CTCGGGATCG 
CGAAACGCCT TCGCTTTGGG CAACATTAAA GGTTTGGTGC TGGTGTGGCG CTTGGACGCG 
CGCGGCGGGT TGACGCGCGC GCCCGCGAGA TTGGCGGCGT TTCCGGTCAG GCGTAGCGCG 
TCAAACAACG TTGCGCCCGA AATCGCGCTC GACGGCTTCG CGGTCGTTCG TCAGTGCGCC 
ATCAATCGCG ACGGCGACGT CGTCGTCGCG GCGTGCGATT CGGGCCTCAT CTGTCGCTGG 
GATTTGGCGA CGCCGAGC

Protein sequence

MARAREAKRA SYAPTCAIRD GQERAHVYCA RFCAIEGVDG KFQRTFATCA GTRADVWECE 
KSGNVVLVAS FETRDANEAF YACEWCAIDS GKLRPCLALA GEGAVVRVVD CVTGRLHVNL 
VGHGGTVNSV VSHPSRPSVV ATASKDLSVR LWHVNTGVTM AILAGARGHR NELLSVDFHP 
AIDAKGQMKL VTGAMDNCVK VWATPPLADS MAKAATWTKP LANFKTIVID TPMFSSSSVH 
DDYVDCVGWL GDAVLSKSVD GIVKLWVPDE PVGVVHARGN QFRSVSAFEQ KDANLWWIRF 
AVSGSRNAFA LGNIKGLVLV WRLDARGGLT RAPARLAAFP VRRSASNNVA PEIALDGFAV 
VRQCAINRDG DVVVAACDSG LICRWDLATP S