Gene OSTLU_47438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_47438
Symbol
ID	5005348
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	189918
End bp	192088
Gene Length	2171 bp
Protein Length	650 aa
Translation table
GC content	58%
IMG OID	640420769
Product	predicted protein
Protein accession	XP_001421229
Protein GI	145353884
COG category
COG ID
TIGRFAM ID	[TIGR00617] replication factor-a protein 1 (rpa1)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.53124
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0322988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCCGCGCGC GCCCGAGCGC ACGCGCGATG CCGCCCGCGC TGACGCCGAA CGCGATATCC 
AATATTCTCG AACAGACCCA CGGATCGCAG GACTTCAAAC CCATCGTCCA AGTGTTCGAT 
CTGAAGGAAT TGAAAACCAA ACCCGACGCC GACGACGCCG CGAAGCGATT CCGCGTCCTC 
GCGTCCGACG GTGGATTCGC GGCGCAGGGA TTGTTCGGGG CGGAGTTGAA CGCGATGTGC 
GAGCGAGGGG AAATTACGAA ATTCACGGTG CTGCGGTTGA GAGAGTACAT CGTGAACGAT 
CTGAACGGGA GACGGTGCGT GCGCGAGATG GGTTGGGATG GGCGGCGCGG CGCGGCGCGG 
CGCGGCGCGA GGGGCGAGAC GAGACGCGCG AGGATGGAGA CGCGCGATCG AGGGATCGCG 
ATGATCTTGG ATGGAAGCGA GGAAGGCGGC GCGATGCGCG AGGGGGGTGA CTGACGATCG 
TGCGAACGGA CGAATGGTTT GAACGTAGGA TTTTGATCGT CATGGACGCC GAGGTGATGG 
ATCGGTACGA CGCCGTCATC GGACAGCCGC GGGTGTGGCA GCCGGGGACT GGGACGAACG 
CGTCGACGGG GATGAACGCG GGGGGGATGC AACAGCAAAG AAACGCGTAC GGAGGAGCGC 
CGGCGGCGCA GGTGGAAGGC TACGGGTCGG GTGGAGGGAA CGGCGCGAAT CTGGCGACGG 
AACCGCCGCG CGCGAGCGGT GGCGGGTACG GTGGCGGCGC GCCGGCGGCG CAGGGGCAGT 
ATCGTCGAGA TGGTGGCGCG GTGGCGCGCA ATGAGCAGCC GAGGTCCATC ACGCCGATCC 
ATGCGTTGAA CCCGTACCAG AACCGTTGGA CTATTCGCGC GCGAATCACG ACTCCGTTGG 
AGTTGCGCTC GTATTCGAAT GCGAAAGGCG AAGGTAAGGT GCTCGGCTTT CAAGTGCTCG 
ATGCCGACGG AACGGAGATC AAGTGCGTGT GCTTTAACGA CACCGCCGTG CGCCTCGCGG 
GGGAGTTACG TCAAGGCTTG GTGTACGAAA TTTCCAAGGG AGCAATCGTC ACGCCGCGCG 
ACCCGCGGTA CGCGATTTAT CAGTACGAAA TTAAGTTGGA TAACCACGCG ACGTTCGTGC 
CGTGTCCAGA CGCCGAACGC GACATCAAGA AGATGGTATA CAAGTTCAAG AAGCTTTCTG 
AACTCGACGC GCTCAACGCC GGAGATATGG TGGATGTCAT TGGCATCGCA TACTCTGTGG 
GTGATTTGAC GACGATCATG AAGCGCGACG GTTCCGAAAC TTCGAAGCGT TCTGTGATGA 
TTCGCGACGA CTCGGACACA TCCATCGAGT TCACGCTTTG GGATCCGCAC TCAGTCGAGA 
TTGGCGGGCA AATCGAAAGC TTGATCGCTA GCGGCGAAAA ACCCGTCATC GCGGTGAAGA 
GCTCTCGATT GGGCGAGTTC CAAGGCAAGA ACATGGGCAC CGTGAGCAGC ACGATGGTAG 
AAATAAATCC CGACAGTTCC GAGGCGACGC GCATGCGCGT TTGGTTTGAT CAAGGCGGCG 
CCGATAAAAC TTTCAACTCC TTGAGCGGTT CTGGCGGTGG CGGCGGCAAA GGCAGTGGTG 
AATTGCTCTC GTTCTCGACT GTGAAAGAGA TCGGTGAAGA ACTCGTGGCT AAAAATGAGG 
GCGTGGCGTA CCTGAGTTGC TGCGGTATCA TAAAGCACAT CAAACTCGGC GCGGAAGGTA 
ACTTCTATCC CGCGTGTCCG TTGCTTAATG GTGAACGCAC GTGCCAAAAG AAGCTGCGTA 
AAGATGACTC GACTGGTGAA TGGAAGTGCG AACGTCACGC CGGTGAAAAA ATCGAAGCCG 
CGGATTGGCG TTACATGTTT AGCATGGTTT GCATGGATCA CAGCGATGAG TATTGGGTGA 
GCGTTTTCGG TGACAAGGGT GACAAGATTT TCGGGATAAG CGCCGCTGAA ATGAAGGAAA 
TCTACGACCG TGAACCGGAG CGATACGAAA ACATGATCAG TGACGCACTG TTCAACGATT 
ACTCTCTACG CGTTAAGGTC GCCGTTGACA ACTACACCGA CGTACCCCGC GCCAAGGGCA 
GCTTGGTTGA AATCGAGCGC GTCAACTACG TAGACATGAG CAAGAAGTTG ATCGGCAAGA 
TTGCAAAGCT T

Protein sequence

MPPALTPNAI SNILEQTHGS QDFKPIVQVF DLKELKTKPD ADDAAKRFRV LASDGGFAAQ 
GLFGAELNAM CERGEITKFT VLRLREYIVN DLNGRRILIV MDAEVMDRYD AVIGQPRVWQ 
PGTGTNASTG MNAGGMQQQR NAYGGAPAAQ VEGYGSGGGN GANLATEPPR ASGGGYGGGA 
PAAQGQYRRD GGAVARNEQP RSITPIHALN PYQNRWTIRA RITTPLELRS YSNAKGEGKV 
LGFQVLDADG TEIKCVCFND TAVRLAGELR QGLVYEISKG AIVTPRDPRY AIYQYEIKLD 
NHATFVPCPD AERDIKKMVY KFKKLSELDA LNAGDMVDVI GIAYSVGDLT TIMKRDGSET 
SKRSVMIRDD SDTSIEFTLW DPHSVEIGGQ IESLIASGEK PVIAVKSSRL GEFQGKNMGT 
VSSTMVEINP DSSEATRMRV WFDQGGADKT FNSLSGSGGG GGKGSGELLS FSTVKEIGEE 
LVAKNEGVAY LSCCGIIKHI KLGAEGNFYP ACPLLNGERT CQKKLRKDDS TGEWKCERHA 
GEKIEAADWR YMFSMVCMDH SDEYWVSVFG DKGDKIFGIS AAEMKEIYDR EPERYENMIS 
DALFNDYSLR VKVAVDNYTD VPRAKGSLVE IERVNYVDMS KKLIGKIAKL