Gene OSTLU_33344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33344
Symbol
ID	5003634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	65923
End bp	67338
Gene Length	1416 bp
Protein Length	471 aa
Translation table
GC content	58%
IMG OID	640419055
Product	predicted protein
Protein accession	XP_001419480
Protein GI	145350151
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGACG TGTGTCTGTA CTCGCCGGCG ACGATCGAAC GCGCGAGATC GGCGCTGCCG 
CGAACGGCGA GCACGTGGCG AGGGACGGTG AGCGTGGCGG TGTTGGCGGA TTTGAAAACG 
CCCGGCGACG CGCTCGACTT GAGCGCGATG GCGAGCGAGT TGGAGGGAGA CGCGGGACGA 
ATCGCGATCA CGATGGTGGA GGCGCTACCG GAGTACGAGA ATAGATTTCC AGTGAACTTT 
TTGCGCAACT TGGCGCGGGA GAAGTGCGTC GCGGAGCTCG GAGCGAAGTA CGTGTTGGCA 
CACGACGTCG ATTTCGAAGT CTTTGTTGCG CCCGACGAGG ACGCGTTTTT GAACGACGTG 
CGAAACGTTT TGGGGAAGCG GAGCGGCGAA AAGGTACGCC GCGCGCTGGT CGTGCCGGCG 
TTTCAACTTC ATGCGGTGTG GTCACAACGA GTGAACGCGA AGAGAGATGC GATTCTGAAC 
GCGCGGCGGG TGCAAAGACA AACAAAGTCT CGCCGCAACG AAGGCAAAGA CGACGACGAG 
TCCATCGACG CCGTCGTGGA CAGTATCGCA ACCAAGGGTG ATGTACGACG ACTAAATCCG 
ATGTCTCTAT ACGAGACGCT CGTTGAAAGA GACCGAACTC GAACGGTCGA CTCAAAAGCG 
ACCGCAATAA ATCTGACGCT TCCGTATTCC ACGCGCGAGC GCCTCGATCG CCTCGTTCGC 
GAGCGTCGAC TTGCGAACGG TTTCCAAATC AATTACTTTC CGATCGCGCA CGCGCCGACA 
AACTACACGG CATGGTTTGA GAACACCACC ACTGGTGCGG ACTCAACGTA TCGCGTCGCG 
ACTCCGAAGC ATCCGTGGTA CTACGAGCCT TACGTCATCG TTCGCGCAGA TCTTGCGTTG 
CCTTTCGATG AGTCTTTCGT GCAGTACGGC TTCAACAAGA TTTCATTCGT TCACGAACTC 
GCCGCGGCGG GATTCGACTT CCACGTTACG AAGAACGCTC ACACTGTCCA TACGAACACA 
CACCCGACGC GTGCAATGGC AAACATGCAA GGACAAGACT TGGCGCGTTG TCGCGCGCAC 
CCTGCAGCGT CGAACGATTT TAGAATCGCT CGAGTCGGGC ACTCATGCAT TCCAGCTTTT 
TTACGCCGAA TGGAGTGCGC GTACGGTTTT ACCTTGGATG ACTTAGAATT CGGTGGCGTA 
TCGAATGCGC CGCCGCCCGA TGATTTGCTT TTTCGCCTAC AGTCGGATGA TAACATCGTC 
TGCTTTGGGG GATGCATCAC GGATTTAGAA GATGCGCCGC GCACGCCGGC TACCGTCACC 
GTGCGAGGCG GACGATTCGT CGGCGTGACG CAAGGCTCAG ACGCTCGTCG GCGTAAACGG 
GGCCCTTGTG AGCGCTTTGA CGTAGCTTTA CAGTAG

Protein sequence

MSDVCLYSPA TIERARSALP RTASTWRGTV SVAVLADLKT PGDALDLSAM ASELEGDAGR 
IAITMVEALP EYENRFPVNF LRNLAREKCV AELGAKYVLA HDVDFEVFVA PDEDAFLNDV 
RNVLGKRSGE KVRRALVVPA FQLHAVWSQR VNAKRDAILN ARRVQRQTKS RRNEGKDDDE 
SIDAVVDSIA TKGDVRRLNP MSLYETLVER DRTRTVDSKA TAINLTLPYS TRERLDRLVR 
ERRLANGFQI NYFPIAHAPT NYTAWFENTT TGADSTYRVA TPKHPWYYEP YVIVRADLAL 
PFDESFVQYG FNKISFVHEL AAAGFDFHVT KNAHTVHTNT HPTRAMANMQ GQDLARCRAH 
PAASNDFRIA RVGHSCIPAF LRRMECAYGF TLDDLEFGGV SNAPPPDDLL FRLQSDDNIV 
CFGGCITDLE DAPRTPATVT VRGGRFVGVT QGSDARRRKR GPCERFDVAL Q