Gene OSTLU_34331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_34331
Symbol
ID	5000620
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	545382
End bp	546704
Gene Length	1323 bp
Protein Length	400 aa
Translation table
GC content	56%
IMG OID	640416041
Product	predicted protein
Protein accession	XP_001416980
Protein GI	145344936
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1222] ATP-dependent 26S proteasome regulatory subunit
TIGRFAM ID	[TIGR01242] 26S proteasome subunit P45 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.926825
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGC CGCGGGCGCC GCCGCCGGAT CCGCGGAAGG AGGCGTTGAG GAAGTACGCC 
GGGTTGTTGC TGCAGCACAA GGTGAGATCG CGCGCGACGG AGAGACCGAA GGATGGTTCG 
TGGACGCGAA CGGTGGTGCG AGGCGTCGTA TTCGAGCGAG TGACTGACGG TTTATTGTCG 
TGATGACGCG CGATGACGTA GGAATTGGAT GCGAGAGTGC GAGCGTCGAG GTTCGAGTTG 
ATTGACATTC GAAAGAGGTT TGACAAGACG GAGGACGATT TGAAGGCGTT GCAGTCGATG 
GGGCAGATTA TCGGGGAGGT TTTGAGACAG TTGGACGAAG ACAGATTCAT CGTGAAGGCG 
AGCTCGGGGC CGAGATACGT CGTTGGGTGC AGAACGAAGC TCGATAAGAG CAAGCTAGTG 
AACGGGACGC GGGTGACGCT CGACATGACG ACGTTAACCA TCATGCGCGC GCTGCCGCGA 
GAGGTGGATC CGTTAGTGTT TAACATGCTC AGCGAGTCCA CGGGGCACGT GGACTATAGC 
TCTATCGGTG GGCTCGGGGA GCAGATTCGA GCGCTTAGAG AGTCGATCGA GTTGCCGTTG 
ATGAATCCCG AACTTTTTGT GCGCGTGGGC ATCGCGCCGC CGAAGGGCGT ATTGCTCTAC 
GGACCGCCAG GGACGGGGAA GACGCTCCTC GCCAAGGCGA TCGCGAGTAA CATCGACGCA 
AACTTTTTGA AGATTGTTTC TAGCGCTATA GTGGATAAGT ATATCGGCGA GTCCGCGAGA 
TTGATCAGAG AGATGTTCGG TTACGCTCGG GACCACGAGC CGTGCATCAT CTTCATGGAC 
GAAATCGACG CCATCGGTGG CAAGCGCTTT TCCGAAGGCA CGTCGGCCGA TCGCGAGATT 
CAACGTACAC TCATGGAACT TTTGAATCAG CTCGATGGTT TCGACGTTCT TGGCAAGGTC 
AAGATGATCA TGGCGACGAA CAGACCCGAT GTGTTGGACC CGGCGTTGAT GCGCCCTGGT 
CGTCTCGACA GAAAGATTGA AATCCCGCTT CCGAACGAGC AAGGTCGCGT GGAGGTTTTG 
AAAATTCACG CGCAAAAGTT GAACAAAGAG GGTGAAATCG ATTACGAGTC TATCTCCAAG 
ATTGCCGAAG AATTCAACGC CGCCGACATG CGCAACGTGT GCACGGAGGC GGGAATGTTC 
GCCATTCGCG ACGACCGCGA TTACTGCGTT CAGGACGATT TCATGAAAGC CGTCCGCAAG 
CTCGTGGAGG CGAAGAAATT GGAACCCGCC GCGTCCTACG ACAGCTCTTT CAAGAACGAG 
TGA

Protein sequence

MTTPRAPPPD PRKEALRKYA GLLLQHKELD ARVRASRFEL IDIRKRFDKT EDDLKALQSM 
GQIIGEVLRQ LDEDRFIVKA SSGPRYVVGC RTKLDKSKLV NGTRVTLDMT TLTIMRALPR 
EVDPLVFNML SESTGHVDYS SIGGLGEQIR ALRESIELPL MNPELFVRVG IAPPKGVLLY 
GPPGTGKTLL AKAIASNIDA NFLKIVSSAI VDKYIGESAR LIREMFGYAR DHEPCIIFMD 
EIDAIGGKRF SEGTSADREI QRTLMELLNQ LDGFDVLGKV KMIMATNRPD VLDPALMRPG 
RLDRKIEIPL PNEQGRVEVL KIHAQKLNKE GEIDYESISK IAEEFNAADM RNVCTEAGMF 
AIRDDRDYCV QDDFMKAVRK LVEAKKLEPA ASYDSSFKNE