Gene OSTLU_33079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33079
Symbol
ID	5003461
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	358898
End bp	360030
Gene Length	1133 bp
Protein Length	322 aa
Translation table
GC content	60%
IMG OID	640418882
Product	predicted protein
Protein accession	XP_001419356
Protein GI	145349883
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.303449
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATA CCGGGGCTGG GTTGACGTGT CACACCGCGC CGGTGCGTCG AAACGAGGCG 
GCGATGACGA GGGAAAGACG AAACGCGTGC CCTCGCGCGA TGGTCGCGCG ACGACGACGG 
GTCGAACGAC GAGAGACGCG CGGTGGTCGC CGTCGACGCG CGCGGTGACT GACGACTGTG 
ATGCACGTTT GTTCGCGCGA CGTTAGGGCG TGGTGTTCGA TACCATGGAT GCGCTGAAGC 
TGCATTACAA ATCGGATTGG CATCGGTACA ACTTGAAGCG CGGCGTCGCC GGTTTGCCGG 
TGGTCGGGAA GGACTTGTTC GACCGCGTGA TGACGCAAGC GGCGGCGCAG GAGGCGGCGA 
GTAAGAAGAG GTCAGAAGGA GGGACGGCTA AGGCGGGAAA ATCGCATCTG AAGCGCAAGG 
ATGAGCTTCC GAGAAGCGTG TTGCGGGCGC AGCGATTCGA GAAGTGGGCC GAGGCGCACA 
AGGAGACGCT GGCCAAGGTG GACGCGTACA TCGCGCGGGG AGAAGAGGTT CCGGAGGCGT 
TGTTGGATGA AATCTCGCGA CGACGAGGCG AAGAGGATGA CGACGACGAC GACGTGGACG 
AGTACGATGG TGAATGGGAA GAAATGGACG AAGATGAAAC GCAAGAGGCG CTGGCGAACA 
TCGAACGCGC CGCGCAAGAG GCGGAGAGTA GCGATGAAGA TATGGACGAT GACGCCCCGG 
CATTTTCCAT GGAAGAACTC ACGAATGGTC CAGTGCGTCT GGCCGACAAC GGCTACGAAC 
TCATCATTAT CGGCGCCGAT GGAAAGGCAA AGCGCATCGG TCCGCGAGAG TTTCGACGAT 
ACTACAAGCA AAATCACCGT CCGAGCGACA GTCGCGATTC TGTTCGCGCC AACGCTCGAC 
ACGCCGGCAT GCAAGTTTCA AGCGACGGCG TTTGTCGTGG TAGTGGCGGT GGAATCACTC 
GCAGAGACTA CCCGACGTTG CCAACCCAAA TTTCCTTGGT GCACCGTCGA GCGCAGCGCG 
CCTTGCGCAA GTACCAAGGC GACCTCATGG TCATGGGTGG AAGCGCGAAC AAGAAGTTTG 
ACATGAGCGG CCGCAATGCC AAGACCAAGC TTCCGAAGGC GTGCCCGTAT TAA

Protein sequence

MSDTGAGLTC HTAPGVVFDT MDALKLHYKS DWHRYNLKRG VAGLPVVGKD LFDRVMTQAA 
AQEAASKKRS EGGTAKAGKS HLKRKDELPR SVLRAQRFEK WAEAHKETLA KVDAYIARGE 
EVPEALLDEI SRRRGEEDDD DDDVDEYDGE WEEMDEDETQ EALANIERAA QEAESSDEDM 
DDDAPAFSME ELTNGPVRLA DNGYELIIIG ADGKAKRIGP REFRRYYKQN HRPSDSRDSV 
RANARHAGMQ VSSDGVCRGS GGGITRRDYP TLPTQISLVH RRAQRALRKY QGDLMVMGGS 
ANKKFDMSGR NAKTKLPKAC PY