Gene OSTLU_87686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_87686
Symbol
ID	5003020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	105539
End bp	106747
Gene Length	1209 bp
Protein Length	402 aa
Translation table
GC content	58%
IMG OID	640418441
Product	predicted protein
Protein accession	XP_001418835
Protein GI	145348807
COG category	[L] Replication, recombination and repair
COG ID	[COG1525] Micrococcal nuclease (thermonuclease) homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.230119
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAGCT TTCACGGAAC TTTCATTCGC AACTGCATCG TCACGCACGT CATCGACGGT 
AAGACCATCC GCGTGCTTCT CAACCCCGAC GGCGGTCAGC AACGCTCGTC CACGGGCGAC 
GGTTGGGAAG ACTCGCTCGT CGTGGGCAGC GAACCCACGT CTCGCATACC GAGCGACGAG 
CTCGACGCGT CGAGCGTCGA CCCGACGACG TGGGAGAAAG TGGACGTGCG GTTGATCTAC 
GTCGACACCG AAGAATCGCT CGATGTGAAG AAGGAGGAGC AAGCGTACAA ACCGATCACG 
CCGGCGGGCG TGGAGGCGTT CGATTGGCTC AAGAAGCGTC TGGGATCGGC GGCGGATGGT 
CGATGCGGCG ACGTCGAGGT GGACATCGAA TTCGACACCT GCGAGTTCAT GACTTCGGTG 
TCTCGCGCGC GCGAGTACTC TCTCGATAAG TACGGACGCG TTCTCGCGTA CGTATATCAC 
AACGGCAACA GCGTCAACGT GGAAACCGTG CTGGCTGGTC AGTCTCCGTA TTTCACGAAG 
CACGGCAGAT CGAGACTCTA TCACGGTGAA TTCGCGCTCG CCGAGAAGCT GGCGATTGAG 
AACATTCGAG GAATCTGGGA CCCAGCCGGA GCGTCTCTCG CATCGTTTGG CATGTTAGAG 
TACAGCCGGG ACTACCGACG ATTGTTGCCT TGGTGGAGAG AGCGAGAATT GTTCATCGAA 
GACTGGCGTC ACTGGGGACA TCTCGGGCTG ACGAAGGACA TTCTGAACCC GCGCGACGCG 
CGAGATTACC AAAAACTTCT AGTCGCCGCG GCTGCGCGCG AAAAGGCGAC AATTTTAGTC 
GATCTTCAGC CGACGCAATC CAATCTTTAC GACGGCGTCA TGCAGCTCAT CCGATACGAA 
GGCGGGAAGC AGGGATTGTG CATTTTCGCC GGCACGCGAC GATATCCGTT TAACCTTTGG 
ATGGACGACG CGAACTCGAT GGAAAGCGGA CGACTTCAGG CTTTACTCCA CGCGCGCTAC 
TGTCAGAACG CTCGCAACTT TTGCTTCATC ACGGGAAGTC TCTTCATCTT TCACGCTAAA 
AATCGACCGC AGATGCTTTT GGAATCGTGC GAGCAAGTCA GCGATTTCCC GTTGCGTCCG 
GATGACATGT CGCAAAAGCT TCGAGGGCAC CACCGCGCGG GCGCCGCCAA GTCCTCGCCC 
GCGGCGTGA

Protein sequence

MHSFHGTFIR NCIVTHVIDG KTIRVLLNPD GGQQRSSTGD GWEDSLVVGS EPTSRIPSDE 
LDASSVDPTT WEKVDVRLIY VDTEESLDVK KEEQAYKPIT PAGVEAFDWL KKRLGSAADG 
RCGDVEVDIE FDTCEFMTSV SRAREYSLDK YGRVLAYVYH NGNSVNVETV LAGQSPYFTK 
HGRSRLYHGE FALAEKLAIE NIRGIWDPAG ASLASFGMLE YSRDYRRLLP WWRERELFIE 
DWRHWGHLGL TKDILNPRDA RDYQKLLVAA AAREKATILV DLQPTQSNLY DGVMQLIRYE 
GGKQGLCIFA GTRRYPFNLW MDDANSMESG RLQALLHARY CQNARNFCFI TGSLFIFHAK 
NRPQMLLESC EQVSDFPLRP DDMSQKLRGH HRAGAAKSSP AA