Gene OSTLU_42373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_42373
Symbol
ID	5003467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	373113
End bp	374282
Gene Length	1170 bp
Protein Length	389 aa
Translation table
GC content	56%
IMG OID	640418888
Product	predicted protein
Protein accession	XP_001419144
Protein GI	145349446
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.159065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAATCA AGGGCCTGAC GGCGCTGATG CGAGACAACG CCCCCGGGGC GATCAAGGAG 
CAAAAGTTCG AGTCCTACCT CGACCGGCGC GTCGCGATCG ACGCGTCGAT GCACATTTAT 
CAATTCATGA TGGTGGTGGG GAGACAGGGC GAACAACAGC TGACGAATGA GGCGGGAGAG 
GTGACGTCGC ACTTGCAGGG GATGTTGAAT CGAACGTGCC GAATGCTCGA GGCGGGAATA 
AAGCCGATTT ACGTGTTCGA TGGGAAGCCG CCGGTGATGA AGGGAGGAGA GCTGGCGAAG 
CGCAAGGACA AGCGAGAAGA GGCGGAGGCG GCGTTGAAGG CGGCGAGAGA GGCGGGAAAT 
CAAGAAGAGG TGGAGAAACT GTCCAAAAGA ACGGTGCGAG TGAGCAAGCA ACACAGTCAA 
GAGGTGATGA AACTCGCGTC GTTGCTCGGA GTGCCCGTGT TCGAGGCGCC GTGCGAAGCC 
GAGGCGTCGT GCGCGGCGAT GTGCAAGGCG GGACTGGTGT GGGCGGTGGC GACGGAGGAT 
ATGGATACAC TCACGTTCGC CGCGCCGCGG TTGGCAAGAA ATTTGATGGC ACCCAAGTCT 
CAGGACAAGC CGGTGCTGGA GTTTGACTAC GACAAAGTTC TAGCCGGTCT CGGGCTCACG 
CCCGAGCAAT TCATCGACAT GTGCATCTTG TGCGGGTGCG ACTATTGCGA CACCATTCGC 
GGGATCGGTC CGAAGACGGC GTTGAAGCTT ATCAAAGAAC ACGGTTCCAT CGAAAAGATT 
CTCGAAGAGA TCGACACTGA GAAGTATCCT CCGCCTCAGG ATTGGGATTT TGCCGGCGCT 
CGTGAGTTGT TCAAAAATCC CGAAGTCATG GACACGACGG GCATCGCATT GAGTTGGAAG 
GCGCCAAACG AGGAAGGATT GATTGACTTT TTGGTCAAGG AAAAGCAATT TAACGAGGAA 
CGCGTGCGCG CCGTGTGCGC CAAAGTCAAG AAGGCGCGCC AAGGTAAAGC GTCGCAAAAC 
CGCCTCGAGA GCTTCTTCGG CCCGCCGACC ATAATCTCCA GTACCATCGG CAAGCGCAAG 
GTTGAAGAAA AGAAGGGTAA AAACGGCAAG GCTGGTCTCG CGAACAAAAA GTCTAAAGGC 
GTCAGTGGCT TCAGACGATC GAAGAACTGA

Protein sequence

MGIKGLTALM RDNAPGAIKE QKFESYLDRR VAIDASMHIY QFMMVVGRQG EQQLTNEAGE 
VTSHLQGMLN RTCRMLEAGI KPIYVFDGKP PVMKGGELAK RKDKREEAEA ALKAAREAGN 
QEEVEKLSKR TVRVSKQHSQ EVMKLASLLG VPVFEAPCEA EASCAAMCKA GLVWAVATED 
MDTLTFAAPR LARNLMAPKS QDKPVLEFDY DKVLAGLGLT PEQFIDMCIL CGCDYCDTIR 
GIGPKTALKL IKEHGSIEKI LEEIDTEKYP PPQDWDFAGA RELFKNPEVM DTTGIALSWK 
APNEEGLIDF LVKEKQFNEE RVRAVCAKVK KARQGKASQN RLESFFGPPT IISSTIGKRK 
VEEKKGKNGK AGLANKKSKG VSGFRRSKN