Gene OSTLU_41898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41898
Symbol
ID	5005224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	+
Start bp	506005
End bp	507225
Gene Length	1221 bp
Protein Length	406 aa
Translation table
GC content	48%
IMG OID	640420645
Product	predicted protein
Protein accession	XP_001421017
Protein GI	145353432
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5021] Ubiquitin-protein ligase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	76
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAGC AACGCCCGCT GTTGCTTTCC GGACCCATGA AAATCCTGTT GAGCAATCCA 
CGCTTGCTGG ACTTCTCCGT CAAACGTGCG GAGATTCGGA CACGAATCAA GAAACTTCGC 
GAACGCCTAG GACATAATCG TCCAGAGGCG CGAACGTTAC ACATTAGGCG TGATCGAATA 
CTCGAAGACT CGTTTAGACA ACTCAACAGC CGGAGTATCG AAGAAATTCG AGGCAAAATC 
AGCATCGTTT TCGTGGGCGA AGAAGGCATG GACGGTGGCG GTTTGATAAA GGAGTGGTTC 
ACCATCTTGG CACGAGAAGT TTTCAATCCA AACATCGCTC TCTTCGAGTT GTCTCACGAC 
AAGGGATGCT ATCAGCCGAA TCAAAACAGT GTGGTCCATC CGGATTATCT CAGCTATTTT 
AGATTCGTCG GTAGACTCGT CGGTAAGGCT TTGTTCGACG ACATTCTCCT CAACGCATAC 
TTCACGCGTC CGATTTACAA GCACCTTCTC GGTCAGCAGC TCACATACGA AGACATGGAA 
GGTGTAGATC CAGATTATTA CAAGAGCTTG AAATGGATGC TGGAGAACTC TGTGGAGGGT 
GTCATGGAAT ACACATTCAG CGACACAACG TCTTATTTTG GTGAAACTCA AGTTCACGAT 
TTGACCGAAA ACGGACGAAA TATCGCAGTG ACAGATGCAA ACAAGTTTGA ATACGTCAAC 
CTGATAACCG CGCACCGAAT GACGAATGCG GTGAAGGACC AACTCGCTGC TCTCGTGAAG 
GGGTTTGAAG AAGTTGTCCC TAGAGAAACG ATTTCCATCC TGAATGCGTC TGAATTGGAA 
CTGCTCATAA GTGGTACCCC GGACATCGAC GTCGAGGATT TACGCGCCAA TACTGAATAC 
ACCGGCTTCA CCGTCGGGTC AAAACAAATT CAATGGTTTT GGGACGTCGT GAGGGAAATG 
AACAAGGAAG ACTTGGCGCG CTTATTGATG TTTTGTACCG GTACCTCTAA GGTTCCTTTG 
GATGGATTCG GTGCTTTGCA AGGCATGCAA GGCCCGCAAC GTTTTCAAAT CCATCGGCAG 
CACGCGGATG ATTCAAAGTT GCCATCCGCA CACACGTGCT TCAATCAACT CGATTTGCAC 
GAATACAGCT CAAAGCAAAT CTTACGCGAC AGGCTGCTGT ACGCGATTGT TGAAGGTTGT 
GAAGGCTTTG GCTTCATTTA G

Protein sequence

MLKQRPLLLS GPMKILLSNP RLLDFSVKRA EIRTRIKKLR ERLGHNRPEA RTLHIRRDRI 
LEDSFRQLNS RSIEEIRGKI SIVFVGEEGM DGGGLIKEWF TILAREVFNP NIALFELSHD 
KGCYQPNQNS VVHPDYLSYF RFVGRLVGKA LFDDILLNAY FTRPIYKHLL GQQLTYEDME 
GVDPDYYKSL KWMLENSVEG VMEYTFSDTT SYFGETQVHD LTENGRNIAV TDANKFEYVN 
LITAHRMTNA VKDQLAALVK GFEEVVPRET ISILNASELE LLISGTPDID VEDLRANTEY 
TGFTVGSKQI QWFWDVVREM NKEDLARLLM FCTGTSKVPL DGFGALQGMQ GPQRFQIHRQ 
HADDSKLPSA HTCFNQLDLH EYSSKQILRD RLLYAIVEGC EGFGFI