Gene OSTLU_17041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_17041
Symbol
ID	5003982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	-
Start bp	222930
End bp	224069
Gene Length	1140 bp
Protein Length	379 aa
Translation table
GC content	58%
IMG OID	640419403
Product	predicted protein
Protein accession	XP_001420116
Protein GI	145351505
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5207] Isopeptidase T
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.852844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0273457
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGCGAG GGGTGGCGAG CGAGGGGAAG CACATGTCGG CGTGGGAGCG CGAGACGGCG 
CGGAGCGAGC GACGGCGACC GGCGCGCGAG ACGGGCGGGA TTGAAAATTT AGGGAATTCG 
TGCTACATCG CCGCGTCTTT GCAGTTGTTG CGAAGCATGC GTGGATTCGT GGAGTCGGTT 
CACGAGGTGT CTGGAGACGA GGACGGTAAA CCGTTACTCG CCGCGCTCGG CGAGTTTTTC 
AGATCGGACG CGAGCGAGTT GAGCGCGTCG GGCGTGAAGC GCGAAATGGG TCGCGTGCGG 
GACGAGTACG GAGAGTTCGA TCAACACGAC GCAATGGAAT TCATGACGCA AATGTTGGAC 
ACGATCGAGC GCGAAATGGG TGACGACGCG GCGCACTGTC CGAGTCGACA AAACTTCGCG 
TGGCGCATCG AGCACGCGCT ATCGTGCGTC AGCTGCGGCG AAAGGAGCGT GATGGACGAA 
TCGATGTACA TGCTGACGTT GCAGCTCATC ATCGACGAGA ACGAGTCTGT CGACGCGCTG 
CTCGATCGGT ACTTCATTCC AGAAAAGCTC GAACGCAAGT GTTCGTGTGG ATGCTTGTTC 
GCAATCTCGA CTCGACAAAT CGTCTCAGAG CCGAAATTCC TCCTCTTGCA CCTCAAGCGA 
TTCAATGCGG TGATAGCGCG CGGTGTGTTG CGTTTGCAAA AGCTCACGGC TTCGATTCGT 
CTTCCTTCAA AGATGTCGCT GATGCACGCT GGATCCGCCG CCGCCGAAAT CGTCGTCCCC 
AAATCGTCTG GAGACGATTC GGATCTCGAA CACGCTAACA ACGCGTCCAA AAGTTCGCCC 
GATACCCCGG GTGTGAAGCG TCACAACACG CGATCGGTGG CGGCTACGAG ACCGTTCGAC 
TTGCTCGCCG TCATCTCGCA CCACGGGAAC ACGGTTGAGC TCGGGCACTT CGTCGCGCAC 
ATCCGCGAGC GCAAATCGAA GGCGTGGAAG ACTTACGACG ACGAGCGCGT GACTTCCTAC 
GTGGCGCGCG ATGAGCTCAT TTTCAACTCG CTTCAAGAAT TCGAACGCGA GTGCTACGTG 
GTCGCTTACG AACGAGACGA TAACGAAAAT CTTCGCCAAG GAAACGCGCA AATATTCTGA

Protein sequence

MWRGVASEGK HMSAWERETA RSERRRPARE TGGIENLGNS CYIAASLQLL RSMRGFVESV 
HEVSGDEDGK PLLAALGEFF RSDASELSAS GVKREMGRVR DEYGEFDQHD AMEFMTQMLD 
TIEREMGDDA AHCPSRQNFA WRIEHALSCV SCGERSVMDE SMYMLTLQLI IDENESVDAL 
LDRYFIPEKL ERKCSCGCLF AISTRQIVSE PKFLLLHLKR FNAVIARGVL RLQKLTASIR 
LPSKMSLMHA GSAAAEIVVP KSSGDDSDLE HANNASKSSP DTPGVKRHNT RSVAATRPFD 
LLAVISHHGN TVELGHFVAH IRERKSKAWK TYDDERVTSY VARDELIFNS LQEFERECYV 
VAYERDDNEN LRQGNAQIF