Gene OSTLU_18363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18363
Symbol
ID	5005653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009369
Strand	+
Start bp	268487
End bp	270169
Gene Length	1683 bp
Protein Length	560 aa
Translation table
GC content	58%
IMG OID	640421074
Product	predicted protein
Protein accession	XP_001421615
Protein GI	145354698
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0904404
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGAGT GGCCGGACGA AGGGTTGACG GTCGAGAGAT TGGTGGAGAC GCTCGTGTCG 
AGAGGGGCGC TTCGCGCGGA TGAGCGCGCG GCGCTCAGGC AGCGCGCGAA ACGCGTCGGC 
GAGGATTGGA CGCGGTATGC GCAAGCCGAG GATCGCGCGG TCTTAAAGCT ACGAAGGAAG 
TTGGTAAAGG GCGAGGACAT TCGCGCGAAT GCGTTGAAGC TGCCGAAAAT CGACTCGACG 
TCGATAAAAG ATTGGACCAA GTCGGATTGG GAACGCTTCT TCAAGGTGGT TTTGGCGTCC 
GTCATCGGCG GTGCCGCGTT ATTTGCGAGC GGAGGGACCG CGACACCGGC GCTAGTGGCG 
GCAATGCACG GACTCGGGCT CGGTGCTGAA GCGTTTTCAG CGTTCGGTGG TTTGCAATGT 
ATGCTCGGCG TCACCGGCGC GTCGCTGTGC GCGCAAAAGA TGGCGAATCG CACCAAGACT 
GAGCTTGAAA ACTTCGACCT CATACCGCTT CGCGGCGCGC ATAAATCGTA TGCCATGCAT 
ATATTCGTTC CTGGGTTTAC GCGCGACGAC CATGACTTAT TAGGCGCTTG GGGTGCGACG 
AACAACCAAT ACGTCTCCGT CGTGCCGGAA TCCCGTTCCG TCGTCCCCGA CCTGGGCATC 
GAGTTCACGA GTGGCGCAGA TGGATCGATC ATCGTACAGG CGAAAGACGA TTCAATCGCC 
AAGCGTCATG GTGTTGTTTC TGGAAGCACT CTGCTGTCTT ATCGATCGGT TAAAAAACCT 
GGCGAGCCGA GTGTCGTGCT CTCCGAACTC GTCGACATGC CGACGTCTGA CGAATTGTCG 
CGAGTGCCGC GCCCAATCGA GATTCGACTG CAGCTCCCCG ATCGCGATGA TGAGCTGAAG 
AAAGAAATGA GCGAGCTCGC GAACGAAATC AAGTCTCAAG TCGGTAATCA TAGCAAGGAA 
GAACACTTGC CGACCGCTGA AGCGGCTATT CGACCCGAGC AACGGCGCTG GGGCAATCGC 
ACGGGCGAGC AACTCGTGTT GAATTGGGAG CCGTCTACAC TCAATGAACT CGGCGCGTGC 
ATGACATCCT GGAACGAGAC GTGCACCGTC AACTTTTACT TAACGCCCGC AGCGTTGGCT 
AAGACTGCGC TCGGAGGGAT CGCTGACGCT ATCGCTTGGC CGGCGACGCT TCTCTCGAGC 
GCGGGTTTCA TCGACGATCC TTGGGCTTTG GTCAAACTGC GCGGAAAAAT CGCGGGCGAA 
GAACTCGCGC AGAGCTTGTT AGATGGCCAG CATGGTCATC GACCGGTGAC GTTCGTCGCG 
TACAGCGCCG GTGCTTACGT CGTTCAGAGC TGCTTGCAAA AGTTGTACGA AGCCGGCGAC 
AGAGGCAAGA ACATCGTCGA CCGCGCAATC TTCATCTCGG CGCCGATTTC TACGTCCAAG 
GACGTTTGGC AGCCGATGCG TGAGGTCGTC TCCGGTCGTC TCGTTAACGT CCACTGCCAC 
ACGGATTGGA TTTTGCTTCT CATGTGGCGC TTCAACATGC TCGATCCCAT GACCAGACTC 
GCGGGCTTGT CCATCGTCAA GCGCGTGCCG AGCGTGGAAA ACTACAACAT TAAAAATCTC 
CGTCACGCGC ATCTCCCCGA CGAAATCTCG CGCGTGCTCG AGGAAATCGA CCTTCAAGAG 
TAA

Protein sequence

MREWPDEGLT VERLVETLVS RGALRADERA ALRQRAKRVG EDWTRYAQAE DRAVLKLRRK 
LVKGEDIRAN ALKLPKIDST SIKDWTKSDW ERFFKVVLAS VIGGAALFAS GGTATPALVA 
AMHGLGLGAE AFSAFGGLQC MLGVTGASLC AQKMANRTKT ELENFDLIPL RGAHKSYAMH 
IFVPGFTRDD HDLLGAWGAT NNQYVSVVPE SRSVVPDLGI EFTSGADGSI IVQAKDDSIA 
KRHGVVSGST LLSYRSVKKP GEPSVVLSEL VDMPTSDELS RVPRPIEIRL QLPDRDDELK 
KEMSELANEI KSQVGNHSKE EHLPTAEAAI RPEQRRWGNR TGEQLVLNWE PSTLNELGAC 
MTSWNETCTV NFYLTPAALA KTALGGIADA IAWPATLLSS AGFIDDPWAL VKLRGKIAGE 
ELAQSLLDGQ HGHRPVTFVA YSAGAYVVQS CLQKLYEAGD RGKNIVDRAI FISAPISTSK 
DVWQPMREVV SGRLVNVHCH TDWILLLMWR FNMLDPMTRL AGLSIVKRVP SVENYNIKNL 
RHAHLPDEIS RVLEEIDLQE