Gene OSTLU_29736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_29736
Symbol
ID	5006897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009375
Strand	-
Start bp	205050
End bp	206538
Gene Length	1489 bp
Protein Length	474 aa
Translation table
GC content	59%
IMG OID	640422318
Product	predicted protein
Protein accession	XP_001422921
Protein GI	145357428
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	0.692446
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0742895
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCGCCATGG CGCCCGCGCG CTCGAACGCG CGCGACGTCG AGTCGCAGGA ATCGTGCGCG 
GCGACGCACT GCGCCGGGAA CGGGCACCCC GCGGTCGCGG CGCTCGTCGC GCCGTTCGTC 
CTCGCGTGGA ACGCGATCGA TGCGTATCTG ACGCCGTGCC TCGGCGCGTA CGCGCGGCTG 
GGCGCGCGCG GCGCGATGGG ATCGCTGTGC TGTTGCCTGC TGGAATGCTT TCGGTACGAG 
GATAAGGTCT GGGCGGGCGA CGCGGCGCTC GGGGTGGATT GCGAATTTCG CGGGTGCGAT 
TGGGCGCGCG TCGACGACCT GAGCGCGGGG AGCGAGGACA AGCCGATGGT GCTGTATCAG 
GGAATCATCG AACCTCGGGA CTGCGTGCAG GGCCAGCTCG GGGATTGTTG GTTGGTGAGC 
GCGCTGGCGT GCCTGGCGGA ACACCCGGGA GCGATCAAAC GGTTGATATT GAACGGGGAA 
AAGTCGCTTC GCGGCAAGTA TCGCGTGCGG TTTTACGACG GCAAGGAGAA GAGGTGGGTC 
ACCGTGACGG TGGACGATCT CATTCCTTGT TACAAGGGGA CGAAGAATCC GATATTTATG 
CAACCGCACA ACAACGAGTT TTGGCCTTTG ATCGTGGAGA AGGCGATGGC TAAGTTTATG 
GGGAGCTACG CCGCGCTGGA CGGCGGGTTC GGCACGTGGG CCACGCACGC GCTCACGGGC 
GATAACGTCT TCTTGCTCAA GAAGCGCATG GACGTCGAAC GCACGTGGCG GCGACACAAC 
ATGAAGTTTA TCGGTAAGCC CGGTGACGGC GGTAAGAAGG ATCGCATCTA TCACGAAGAA 
GTCGAGGAAA ACATCGTGCG CGATAAATTG TTCAACATCC TGACCCAGTA CGACAGCATC 
AAGTCCCTGA TCGCCGTGTC GAGGATGACT AAAAATGGCG AGAGCAAAGA CGAAACCACC 
GGCTTGGTGT CCGGTCACTT GTTCTCCGTC ATCTCCGTGC GTTGGGCTGG ACGCTCTTGG 
GGCGTCGGTG GAAAGCGTTT CATCAAGCTT CGCAATCCGT GGTCGACGTT TGAATGGAAG 
GGCGCTTGGG CTGATGGATC GAAAGAATGG GACAAACACC CGGCCATCGC GAAGGAGCTC 
GCGTACGTGA ACGATCATCA CGACGGCGTG TTTTGGATGG AGTTTGACGA TTTTTGCGAG 
TACTTCAACC AAATCGCGGT GTGTGACCGA ACGACAAAGC GCGACTTTTC GCTCCGGTAC 
GATCACGACA ATAAATATTG TGGTCCATTG ATGGGCTGCG TGAGCGGTTG TGCGTGCTTC 
TGGTGCGGAT GCCAAGGTCC GTACAAACTT TATTGCGGAC ACCAATCGAC GACCGAAACG 
CGTCAGGCGA CCAAGTGCTG CGGCACGATG AAAGTCGCGA ACGACGCGTG AATAAATTAA 
CGACTACTTT ACGCGAGTCG GCTTGTAATG AATTTGAGAG CTCTGTCTC

Protein sequence

MAPARSNARD VESQESCAAT HCAGNGHPAV AALVAPFVLA WNAIDAYLTP CLGAYARLGA 
RGAMGSLCCC LLECFRYEDK VWAGDAALGV DCEFRGCDWA RVDDLSAGSE DKPMVLYQGI 
IEPRDCVQGQ LGDCWLVSAL ACLAEHPGAI KRLILNGEKS LRGKYRVRFY DGKEKRWVTV 
TVDDLIPCYK GTKNPIFMQP HNNEFWPLIV EKAMAKFMGS YAALDGGFGT WATHALTGDN 
VFLLKKRMDV ERTWRRHNMK FIGKPGDGGK KDRIYHEEVE ENIVRDKLFN ILTQYDSIKS 
LIAVSRMTKN GESKDETTGL VSGHLFSVIS VRWAGRSWGV GGKRFIKLRN PWSTFEWKGA 
WADGSKEWDK HPAIAKELAY VNDHHDGVFW MEFDDFCEYF NQIAVCDRTT KRDFSLRYDH 
DNKYCGPLMG CVSGCACFWC GCQGPYKLYC GHQSTTETRQ ATKCCGTMKV ANDA