Gene OSTLU_18438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18438
Symbol
ID	5005966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	+
Start bp	7303
End bp	8841
Gene Length	1539 bp
Protein Length	512 aa
Translation table
GC content	55%
IMG OID	640421387
Product	predicted protein
Protein accession	XP_001421808
Protein GI	145355103
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGGG CAACGTTCAA GTTGTCGGTC GAAATCGTGC CCGAGAATAG ATTGTTGAAT 
CCCGCGCAGA CAGCCGCGCT CGAGGGCATT TTTACGAAAT GCTGCTCGTC GACGACGTCG 
TGCCCGGTTT GGAAAACTGC CAGAAGATAC GGTTACGATC CCTGCCACTG GGGCTTGGCT 
GGATGCACGA AGGCGAACGA GACGAAATGG TTGAATCTGC AGGGGCTGTA CTTGGATTGC 
GAGCTCGGTT CATCCGACGT CAGCGCATTC GGGTCGTCGT TGCGTAGGCT GTATGTCGGA 
CAAAACACGG CGCTGAAACT CGCCGACGAA GACGCGACGA TTGGATTGTT GAAGGTGCTT 
CCGAATTTGG TAGAAATAGA CGTCACCGGA ATCGATCTAC AGGGGCGAAC CGTGGATGGA 
CTGTGTCACG CATCGGTGAG CGCGAACTTG ACGCGTATCG GTTTGAACAC GGCGAACGTG 
TCGGGTGCGT TGTCACAGTG CGTGGTGGAT AAACCTCAGT TGATGGATCT CGCGATGCAG 
TACAATTACT TGACCGGAAC GCTGCCATCA CTACCATCGT CGTCCAACTT ACGAACGTTG 
TATCTCCACG AGCAAAGGTC GGCAGACAGC ATCAGCGGCG TTCTACCGCC GTCGTACGTC 
AGCTCGACGA CGCTCGAGCA CTTGTGGCTG ACCAATCTGA AACTCTCGGG CGCGTTGCCC 
GACGTGTTTT CGCCGACAGG CGTGTGGCGA GAGATATACT TGAACAAAAA TGCATTTAAC 
GGTACGATTC CAGCGTCTCT GGGCTCGCAG CGATATCTGC CGGTGCTCGA CTTGTCCTTC 
AACGCGTTCT CAGGAGCGGT TCCCGGCGGT ATTTACGATC ACCCGAACCG CACGCACGTT 
GGCATCAAGT CGAACAAATT GACGCAAGTG AGCGTGTCCT CAATCCACAG CCCGCCGGGC 
GCGTCGCTGA TACGTCTCGA TGCGTCCAAA AACGTAGTCA ACGAGACGGG CGTGTCGACG 
ATATTCACTC GAATGCCGAA GCTGCAGTAT CTCTACTTGA ACGACAATGA ACTTCACGGC 
GTCATCTTGG ACGACTCGAC GACGCCGGTT TGGGCGCTTC GGCAATTAGA CGTGAGTACA 
AACTATCTCG AAGGCGAAAT TCCTGGCGCC TCGTATTGGG GTAAAATCTT CACGTCGAGC 
GCGCCCGCGG GACGAAAGTT TGACATATCG CAAAACCTGT ACACCAGAGC CCCATCCTGG 
TTCGGCGCTT ACACCGGCGA TTCTGGTCTG ACGATCACAC TGGGCAGCGG GTTGTACGAT 
CCATCCTCCG ATCCCGACGC CGCGCTCGCG TCTGCGAATG CAAAGCCTAC GGTGTCGAAA 
TTCATGCTAG CGCTGTTGCT CATAACGCTC TTCGCCATGA GTGGACTGGG CCTGTACTTG 
GGCATTTATA TCTTGGTGCA ACGGCGAAAT CGGGCGCACG CGAATCGCTT TAGGCAGTTT 
CATGACTTTG ACCAAGGTCA AGGCGTCGAG ATGGCGTAA

Protein sequence

MHGATFKLSV EIVPENRLLN PAQTAALEGI FTKCCSSTTS CPVWKTARRY GYDPCHWGLA 
GCTKANETKW LNLQGLYLDC ELGSSDVSAF GSSLRRLYVG QNTALKLADE DATIGLLKVL 
PNLVEIDVTG IDLQGRTVDG LCHASVSANL TRIGLNTANV SGALSQCVVD KPQLMDLAMQ 
YNYLTGTLPS LPSSSNLRTL YLHEQRSADS ISGVLPPSYV SSTTLEHLWL TNLKLSGALP 
DVFSPTGVWR EIYLNKNAFN GTIPASLGSQ RYLPVLDLSF NAFSGAVPGG IYDHPNRTHV 
GIKSNKLTQV SVSSIHSPPG ASLIRLDASK NVVNETGVST IFTRMPKLQY LYLNDNELHG 
VILDDSTTPV WALRQLDVST NYLEGEIPGA SYWGKIFTSS APAGRKFDIS QNLYTRAPSW 
FGAYTGDSGL TITLGSGLYD PSSDPDAALA SANAKPTVSK FMLALLLITL FAMSGLGLYL 
GIYILVQRRN RAHANRFRQF HDFDQGQGVE MA