Gene OSTLU_31007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_31007
Symbol
ID	5001377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	143842
End bp	145809
Gene Length	1968 bp
Protein Length	655 aa
Translation table
GC content	57%
IMG OID	640416798
Product	predicted protein
Protein accession	XP_001417434
Protein GI	145345894
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	0.906185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGACG GGCATCGCGA GAAGCGCGCG AAGCTCGAGC CGCCGGCGCT CGCGAACGAA 
AGGTTCGAGG CGTATTACGC CGCGCAGGGC GTGTGCGAAG ACGCGGGCGA CTTTCGAGCG 
ATGATGGAGG CGTTTCGAAG ACCGCTGCCG CTGACGTTTC GACTGAACGC GTCGACGGCG 
CTCGTGGAGG CGGTGCGGAG GAAGCTGGAG GGCGACGTGT TGCCGGCGCT GAAGCGCGAG 
GCGTCGATGA AGCCGCCGAA GTGCGTCGCG TGGTATCCGG ATCGTTTGAG CTGGCAGATA 
GATATATCGC AGAGCGCGTC GTTGAAACAG AGTGAATCGC GCGGCGTGCT CGGGTTGCAC 
GCGTTTTTGA AGAGCGCCGG GGAGACGGGG GCGCTGACGA GGCAAGAGTT GGTTTCGATG 
ATTCCGCCGT TGTTTTTAGA GGTGAAACCG AAGCATCGCG TGATCGATAT GTGCGCCGCG 
CCGGGAAGTA AGACGTCACA GTTATTGGAG ATGTTGCACG GCGCGACGAA CGCTGGGGAG 
ACGCCTCGAG GGGTGGTGGT AGCGAACGAC GCGTCTTTAC AGCGAGCGAA TTTGCTCACG 
CATCAGTGCA AGCGAAGCAA CTCCCCGGCA CTCGTCGTGA CGAATCATCA GGCGCAGTTG 
TTTCCAATTT TACACGACGC CAAGGGAAAG AAAATTAGGT TCGATAGAAT TTTAGCCGAC 
GTCCCGTGCA GCGGTGATGG GACGCTGCGG AAATCGCCCG ACCTTTGGAA GAAGTGGAAC 
GCCTCGAGCG GGGTGGATTT ACACACGCTT CAGCTTGAGA TCGCCACCCA CGCCTTGCGC 
TTGCTCGAAG TGGGTGGGCG TTTAGTCTAC TCGACGTGCA GTTTGAACCC ATTGGAGAAT 
GAGTCCGTCG TCGCGGCGCT GTTGAAGCGC GCGAAAGGCT CTGTGGAGCT CGTCGACGTC 
TCGAAGAGCT TGCCCGAGCT TAAGCGACGA CCGGGGATGA AGAGATGGAA AGTCGGTGAT 
ATATACGGAT GGCACGACTC TTTCGAAGAG ACTGGGAAGA AACGCATGAA AACCGTGGCG 
AAGACGATGT TTTGGAACCG AGAGTATGAC GCGATGCCGC TCGAGAGATG CGTTCGAGTA 
TTTCCCCATC TCGACGATAC GGGTGGATTT TTCATCACCG CGTTGAAGAA GACGGCCGAG 
TTGCCTCCGG AGATGGAGCA AACGCCGCAA ATGGACGCAA ACAAGACTTA TAGAATGGAG 
CGTGCGAATG AGCAGTGGAA CGAAAAGAAA CGTGTGGCGC CGGTGATGAA GGTTGAAGAC 
AGATCCATCG TGAAGAGCAT CAATAAACAT TACGGCGTGC AAGACGCGCT CGATCTGGAC 
GACGCGTTGA TGACGCGTCA GCACTCCGAC CTTCCGGGTG TCACTCCAAA GCGTCTATAT 
TACTTGTCCG ACGGCGCACG AAAAGTGTTG ACGGCGCGGG GAAAGGATGG CAAGAACGCT 
GGTTTGCAGG TCGTTGCGTG CGGCGTTCGT GCGTTTGAAC GTCAAATCGT CGACGGCGTC 
GAGTGCGCTT ATAGAATCAC GCAAGAAGGC CTCGACACCG CACTGCCATG CTTAAAGAAG 
CAAATCGTCC GCGTTCGTGC GAGCGAGCTG GAAATCATTC TCGCGCGGCA GCAAGACGAA 
AACGTGGGCG CGAATTCGTC GTCGCGATCG AGCTCGGACG ACGTCCCCGA GGAAATCACG 
AATGCGAAAT CCATCGAACA TCTAAAAAAG GTGTCCGATG GGTGCGTTAT TTTAGTCCCT 
AAAGCAAGAG ACGACGACAC AGAAACCGAG GCCAAGGCTC TGGCCGTCGC CGCGTGGCTC 
GGCCGCGGTA AAAAAGGGAA ATCGATCTCG GTGTTGGCCA GCAAAGCGAG CGGGGGACAG 
TTATTGTATC AACTTCGCGA TTGTATGTCG CGCGGCACGG TGGTGTGA

Protein sequence

MDDGHREKRA KLEPPALANE RFEAYYAAQG VCEDAGDFRA MMEAFRRPLP LTFRLNASTA 
LVEAVRRKLE GDVLPALKRE ASMKPPKCVA WYPDRLSWQI DISQSASLKQ SESRGVLGLH 
AFLKSAGETG ALTRQELVSM IPPLFLEVKP KHRVIDMCAA PGSKTSQLLE MLHGATNAGE 
TPRGVVVAND ASLQRANLLT HQCKRSNSPA LVVTNHQAQL FPILHDAKGK KIRFDRILAD 
VPCSGDGTLR KSPDLWKKWN ASSGVDLHTL QLEIATHALR LLEVGGRLVY STCSLNPLEN 
ESVVAALLKR AKGSVELVDV SKSLPELKRR PGMKRWKVGD IYGWHDSFEE TGKKRMKTVA 
KTMFWNREYD AMPLERCVRV FPHLDDTGGF FITALKKTAE LPPEMEQTPQ MDANKTYRME 
RANEQWNEKK RVAPVMKVED RSIVKSINKH YGVQDALDLD DALMTRQHSD LPGVTPKRLY 
YLSDGARKVL TARGKDGKNA GLQVVACGVR AFERQIVDGV ECAYRITQEG LDTALPCLKK 
QIVRVRASEL EIILARQQDE NVGANSSSRS SSDDVPEEIT NAKSIEHLKK VSDGCVILVP 
KARDDDTETE AKALAVAAWL GRGKKGKSIS VLASKASGGQ LLYQLRDCMS RGTVV