Gene OSTLU_17261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_17261
Symbol	PAFE3501
ID	5004330
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	+
Start bp	160506
End bp	161953
Gene Length	1448 bp
Protein Length	447 aa
Translation table
GC content	59%
IMG OID	640419751
Product	predicted protein
Protein accession	XP_001420262
Protein GI	145351823
COG category	[K] Transcription
COG ID	[COG5157] RNA polymerase II assessory factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.474377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0107383
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCCTT TGCGTTTGAT TAGAGATCAT ACCATCGCCG GTATAATCGC CGAGTGCGTC 
CTCGACGCGC CGCCGCTCAC GCGCTCACGC GCCGCGCGCC GCGCGGAAAC GGTTCGAACG 
CGCGCGACTG ACGATGGGCG CTCGAAACGG GACGTAGGTC GACGCACGAC GATGAAAGGA 
TTCACCTGAA GGATGTCGAC GTCGAGCTCC GGCGGACGAC GGAGACGAAT TACAGATCCA 
AGGCTGGGAA CAAGCTGCTG AAGGTGGAGG CGATATGGTA TTTCATCAAG TATCACGTTG 
CGAACCCCGA CGCGGCGCAC ACGGCTTACA TGAAGGCGGC GATCGCGGCG GGGTTCTCGA 
CGCTGTCTAT GTTGGATCGG AAAGATTTGA TCGCGTACTT GACGGGGGAG CGAGCTACGA 
GCGATCGAAT CGATATCACC GTGCCGGTGA TCGTGGATGA GGAGGGTGTG TCGACGGTTG 
ACGCGAAACG CGCGCGCGAG GAAGACGAGG CGGAAGGCGT GCCGCGAGAG CGCGTGTTAA 
GAGATAGGAA CTCAGTGCTT CGCGCGCCGA AGGATATGAC GAGCGTGTTG GATTTCTTCG 
CGGCGCCGGA GGAGGAGAAG GAACGTTTAG AAGAGGAGAA GCAGCAGGCG GCTGATTTAG 
CCAAGGGGAT TAAAAACCAG AGATATCGCG ACGTGAAGGA GCAGGTGTTT TGGAGAGAGC 
ACGTCGGGAG CGACTTTGAT ATGATGAATT TGGACACCAA TGCGTCCTTC TTGAGTGGGC 
CCAAGCCACC CGTAGACGAC GGCACCGACA TGTTGATGAC GGACGCACGC GCGATGGAAA 
AACAGCCGAC CGCACCGAGC GGTCCGTCGA CTGCGAGTCG TGGAGGACCC GCTGCGGCCG 
CCAAGGCTCC GCGCAAGACA TCAGGCAAAC CGGGCGGCGT CCCGATCATC ATCGTCCCCG 
CCGGGTTCAA TCAAAAGGTC GTTCTCAACA TGTTCAACGC CAAGGAGTTC TTGCAGGACG 
GCAAGTTTAC GCAGTGGGAT GTGGTGCAAA AAGGCGGCGC TAAAAAGTCA AGCTCCGTGT 
ACATTTCGCG CACGTACAAG CGCGACGGCG CCAAGGTCAA GTACGAAGTC ACCGAAAAAG 
CCCCTCACAA ACGTTCCGAA GACTGGGCCC GCGTCGCCGC GGTCTTCGTC CTCGGTGCTA 
AGTGGCAATT CAAAGACTGG CCCTTCCGCG GCGTCGAAGA CGGTGATCTC GTCGAAACCT 
TCACCAAGAT TCGCGGCTTT CACGCCCGCT TTGACGGCGA TCCCGAAGTC GACGTCGTCA 
AGACCTGGAA CGTCAAGCCC ATCACCATCA GTCGCACCAA GCGTCACGGC GATCGCGCCG 
CGTTCGAGTT CTTCTGGGAC GAGCTCGATC GTCACCTCGC CCTTCGTAGC AGCGCCTTGA 
AGTATTAA

Protein sequence

MDPLRLIRDH TIAGIIAEST HDDERIHLKD VDVELRRTTE TNYRSKAGNK LLKVEAIWYF 
IKYHVANPDA AHTAYMKAAI AAGFSTLSML DRKDLIAYLT GERATSDRID ITVPVIVDEE 
GVSTVDAKRA REEDEAEGVP RERVLRDRNS VLRAPKDMTS VLDFFAAPEE EKERLEEEKQ 
QAADLAKGIK NQRYRDVKEQ VFWREHVGSD FDMMNLDTNA SFLSGPKPPV DDGTDMLMTD 
ARAMEKQPTA PSGPSTASRG GPAAAAKAPR KTSGKPGGVP IIIVPAGFNQ KVVLNMFNAK 
EFLQDGKFTQ WDVVQKGGAK KSSSVYISRT YKRDGAKVKY EVTEKAPHKR SEDWARVAAV 
FVLGAKWQFK DWPFRGVEDG DLVETFTKIR GFHARFDGDP EVDVVKTWNV KPITISRTKR 
HGDRAAFEFF WDELDRHLAL RSSALKY