Gene OSTLU_43137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_43137
Symbol
ID	5005576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	352378
End bp	353583
Gene Length	1206 bp
Protein Length	402 aa
Translation table
GC content	61%
IMG OID	640420997
Product	predicted protein
Protein accession	XP_001421269
Protein GI	145353969
COG category	[R] General function prediction only
COG ID	[COG1204] Superfamily II helicase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGGCG CGCCCCCGCC CCTGTACCCG TGGCAGGCCG AAGCGATAAA CCTCGTCGCC 
GCGTCGCGTC GCTCGCTGTG CTACACGGCG CCCACGGGCG GCGGTAAAAG TCGCGTCGCC 
GATGAGTTGT TACGACTGTC CCTGACAAAC TTTCCCGCGG CGAAAGCGCT CGTCGTGCTG 
CCGTACGTCG CGCTCGTGCG GGAAAAAGTG GCGTCGTTGG AGTCGTTGTT ACGCCCGCTC 
GGGATCAAGG TGAGGGGCTA CGCCGGGGTG GAGTGCGAGG GGGCGCCGTT GGGGAGCTCG 
AGAGAGCGCT GCGCGGTGAC GACGATTGAA AAGGCGTCGT CGTGCGTCAA TAGACTGTTC 
GAAACGGGCG AGATATCGCT GCTCAGCGTC GTGGTGGTGG ATGAGCTGCA CATGGTCAGC 
GAAGACGAAC GTGGGTGCGC GCTGGAGGGG ATGTTGGCGA AGATACGACA CGGAGTGAAG 
TCGGGAAAGG TGTCGAGCGA CGGCCCGCAA ATCGTGTGCA TGAGCGCGAC GGTGGGAAAG 
TCATCGATGG AACGCTTAGC GAGGTGGTTA GACGCGGAGA TTTACGTCAG TCATCATCGG 
CCGGTGGAGT TGAAAGAGTA CGTGGTGTGC GTGGGTGGGG TGTATGCGAA GGAGAATCGA 
GGTGAGGCGG GCTGGGAGCT GACGCGCGTG GCCGATTCGC CGTCGCGAGT GGAGTTGGAG 
ATCGTCGCCG AACTGGTTGG TCAAGTGTTC GTCAACGCGC ACAGCTCGTT GGTATTTTGC 
TCGAGCAAGA GTCAGTGTTC AGTTTATGCG ACGAAATTGG CGAGCTTGCT TCCGGTGAAT 
CCGAACACGG CGCACCTGCG AGAAGAGTGC GTGGCGAGAC TCTACGAAGC TGCGGAGGGC 
GAGCCCGACC AAGCGCTAGT AGCGTGTGTT CGCTCCGGTC TCGCGTGGCA TCACGCCGGA 
TTAACGACGG CAGAGAAGAG AGTAATCGAA GAGGGCTTTC GAGCTGGTGC GATTTTAGCG 
CTCACATGCA CGACGACTCT TGCTGCGGGC GTCAACTTGC CCGCTCGCCG TTGCGTCATC 
CTTCGCGGCT TCATCGCCGG TTTACCGACG CCTTCGATGG CTCAGTACAA ACAAATGGCT 
GGTCGAGCTG GAAGAAAAGG GCAAAGCGAT TTCGGTGAAT CTTTCCTAGT CACGACGAAA 
CAAGAG

Protein sequence

MRGAPPPLYP WQAEAINLVA ASRRSLCYTA PTGGGKSRVA DELLRLSLTN FPAAKALVVL 
PYVALVREKV ASLESLLRPL GIKVRGYAGV ECEGAPLGSS RERCAVTTIE KASSCVNRLF 
ETGEISLLSV VVVDELHMVS EDERGCALEG MLAKIRHGVK SGKVSSDGPQ IVCMSATVGK 
SSMERLARWL DAEIYVSHHR PVELKEYVVC VGGVYAKENR GEAGWELTRV ADSPSRVELE 
IVAELVGQVF VNAHSSLVFC SSKSQCSVYA TKLASLLPVN PNTAHLREEC VARLYEAAEG 
EPDQALVACV RSGLAWHHAG LTTAEKRVIE EGFRAGAILA LTCTTTLAAG VNLPARRCVI 
LRGFIAGLPT PSMAQYKQMA GRAGRKGQSD FGESFLVTTK QE