Gene OSTLU_42117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_42117
Symbol
ID	5006317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009371
Strand	+
Start bp	309808
End bp	311148
Gene Length	1341 bp
Protein Length	446 aa
Translation table
GC content	58%
IMG OID	640421738
Product	predicted protein
Protein accession	XP_001422155
Protein GI	145355838
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.0484588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAATG TCGATCGCGA ATGCGGGACG ACGGCGGAGC GACGAGGGAA GTACAGGTCG 
AGCGAGACGC ACGAGGAGCA CGTGAATAAG AAGATACACG CGGCGAAGCG GCGGACGAGG 
AGCGAGCTGT CGGTGCGACA GGGAGGGTGG GCGAAGCACG GGTACGCGTA CGAGGACGCG 
GACGCGACGT CGCGGTCGTT GAAACATTTA CACGCGATCG AGCGGATATC GGTGAAGACG 
ACGACAAAGG AAGAGTTTAT CGAAAGGTTC GAGAGGACAC GGACGCCGTG CGTGATCACG 
GACGCGATGG AGGATTGGGG GTGTTATAAA AACGACGGCG GGCGGTTTTG GAGCGTAGAC 
ACGCTCGCGG AGCGGTTTCG AGAGGTCAAG TTCAAGGTGG GGACGGACGA CGATGGGTAC 
CCGGTGCGGT TGAAGATGAA GCACATTCAG CATTACGTGA ACGATCCGGT GCACATGCGA 
GACGATAGTC CGATGTATGC GTTCGACGGG AGCGTCTTTG ACAAGCCGGA GACAAAGTCG 
TTATTGGAGG ACTTCAAGAT TCCAGATTGG TTCGAGGAGG ATTTGTTCAA GCACGTCGGG 
GCGAAGCGTC GACCGCCTTA TCGATGGATC GTTTTTGGGC CGCCTCGGAG CGGTTCGTCC 
GTGCACGTTG ACCCGTTGGC GACGAGCGCT TGGAATGCGT TGATTTCGGG ACGCAAGCGT 
TGGGCGCTTT ATCCGCCGCG CTCGGTGGAC AAGGCGACGA TCAAGCCGCG AGGAATTGGT 
CTGGATGGTG AATCGGTGAC CTGGTTCAAC AAAATGTACC CTCGAACGAC GACAGAGGAG 
TGGAAGCGCC AAGGATTGCC CCCACCCATT GATGTCATCC AACATCCTGG GGAAATCATG 
TTCGTTCCAG ACGGTTGGTG GCACGCAGTG CTGAATCTCG ACCACACCAT GGCGGTGACG 
CAAAACTTTT CGACTTCCGC CCGATTCGAC GCGGTGTGGC GCATCACGCG TCGAGCGCGA 
CCGAAAATGT CTGCTAGATG GCTGGAAAAG TTGCGACGGG TTCGTCCAGA TTTAGCCGAG 
GTGGCGGATG CGCAGCCTCG TCGAAGCGAA GTCAGCGCAG GTGAACAAAC GAGTTCGACG 
AGCAGTTCAT CCTCTGGTTC AAGCGATACC GAAGCCGAAG CCGAGGACGA GGTCATGACG 
AAAGAACGCG AGACCTTTGA GCGAGCCGCG GGGGGCGGCG GCGACGCCTC GACCAAACGC 
ACGAGAACTG GAGACGGTTT GATCGCCGAC CTGGCCGCGG AAAAGATGCG CGCGGCGTCG 
AAATCGATGG ACATCAACTA A

Protein sequence

MRNVDRECGT TAERRGKYRS SETHEEHVNK KIHAAKRRTR SELSVRQGGW AKHGYAYEDA 
DATSRSLKHL HAIERISVKT TTKEEFIERF ERTRTPCVIT DAMEDWGCYK NDGGRFWSVD 
TLAERFREVK FKVGTDDDGY PVRLKMKHIQ HYVNDPVHMR DDSPMYAFDG SVFDKPETKS 
LLEDFKIPDW FEEDLFKHVG AKRRPPYRWI VFGPPRSGSS VHVDPLATSA WNALISGRKR 
WALYPPRSVD KATIKPRGIG LDGESVTWFN KMYPRTTTEE WKRQGLPPPI DVIQHPGEIM 
FVPDGWWHAV LNLDHTMAVT QNFSTSARFD AVWRITRRAR PKMSARWLEK LRRVRPDLAE 
VADAQPRRSE VSAGEQTSST SSSSSGSSDT EAEAEDEVMT KERETFERAA GGGGDASTKR 
TRTGDGLIAD LAAEKMRAAS KSMDIN