Gene OSTLU_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_1559
Symbol
ID	5005774
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009369
Strand	+
Start bp	436982
End bp	438508
Gene Length	1527 bp
Protein Length	486 aa
Translation table
GC content	56%
IMG OID	640421195
Product	predicted protein
Protein accession	XP_001421664
Protein GI	145354801
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCCGG TGAATCTCGG ACGGAAGTCG CGGGCGGCGT TTGAGAACGT CTTCAAGCAG 
CTGACGTCGT TGACGTCGTT TCAAAAGTCC ACGGCGCCGA CGAACGCGAG AGAGTTTGAT 
CAGGTCTACG ACGCGGATTT GCTCAGTGGG AGCTCGGTGG GGGAGTTCGA GACGCCGAAC 
GCGAAGTTTA CGACGGTGTT GGTCACGGGG GCGACGGGGC GCATAGGTCG CGTTTTGATT 
CGCAAGCTCT TGTTGCGCGG ATACACAGTC AAGGCGCTCG TGCGTCGCCA GGAAGACGTC 
GAGAAGCTTC CGGGTTTGGT ACAAGTCATC GTCGGGGACG TCGGGGAGAA AGAAGTGATC 
AAAAATGCCA TGATTGGCGT GAACAAGGTG ATTTACTGCG CGAGCGCAAA AACCTCCGTC 
ACGAGCGACT TGTACAACGT CGCCGACCAA GGTGTGAAGA ACGTGGTATC GTGCATGCAA 
GACTACTATC ACATGCTCGC TTCCCGTCGC GCCGGTCGCA GCGCCAAGTC CAAGGTGATG 
TTGACCAACT TCAAGCACCC GACGGCGTAC GAGGCGTGGG ACGTCGAAGA GATCGAAGCC 
GACGCCGGCG CCGGCGCCGA CGGGCGATGG GCCGCCGCGG CGGAGATGCA GCGTGTGAAC 
TTCGATCCGC TCTACCCCGA AGACGAGGAC AAACCTTTCG AATTCGCGAC GTTCAACGGT 
TTCATCACCT CTCGTACGGG TAAGGCTGAA GTGAGCTCAA ACGTCGAAGG TTTGCAAGCC 
GACGTCGACT TTTCAGCCAA GGAAGGTTTG TTGTTCCGTT TGAAGGGCGA CGGGAAGCGC 
TACAGCGTGA TGCTCACGCA GGACGATGGT TCCAAGTTCA GATTTTCGTT CAACACCACT 
GGGGGATGGC AAGTCATTCG TATGCCGTTT CACAAATTCG TCAGTGAAGG GAAAACTTCT 
TGGGGAGACG ACGGCGACGC CATTCTCGAC TTGACGAGAA TCGAGAAGAT TGGCGTTCGC 
TTCGATGCGA GAAAGAACCA ACGCGAGACG ACGATGTCAG ACGTGATGAG TGGGAACAAT 
AACATGTTCA ACTTGACGCT CGAGTACGTC AAGGCGATTC CCAAGGGCGA GGAACCCGAT 
GTCATTTTGG TTTCGTGCTT CGGCGCCGGT TTGGAAGAGG GCGAAGAAAA GGAACGTATC 
CTGAAGATAA AGCGTGACGG TGAACGCGTG CTGCGCAACT CTGGTGTAGG ATACACCATC 
GTTCGCCCGG GTGAGCTCGT CGAAGAGGCT GGTGGGGGCA AGGCGTTGGT TTTCGATCAA 
ACCGAACGCA TCAACACGCC GATTTCTTGC GCCGACGTCT CCGACGTCTG CGTCAAGGCG 
ATGCACGACG AAGAGGCGCG TAACAAGAGC TTCGATGTCG GCTACGAGTA CGAAAGCGAG 
CAAGCCGAGT ACGAGCTGAT CACCCAAGTC AAAGGCAAAT CCGACAACTA CCTCACTCCG 
GCGTTGAAGG TGCTCGAAAA GAACTCG

Protein sequence

VNPVNLGRKS RAAFENVFKQ LTSLTSFQKS TAPTNAREFD QVYDADLLSG SSVGEFETPN 
AKFTTVLVTG ATGRIGRVLI RKLLLRGYTV KALVRRQEDV EKLPGLVQVI VGDVGEKEVI 
KNAMIGVNKV IYCASAKTSV TSDLYNVADQ GVKNVVSCMQ DYYHMLASRR AGRSAKSKVM 
LTNFKHPTAY EAWDRVNFDP LYPEDEDKPF EFATFNGFIT SRTGKAEVSS NVEGLQADVD 
FSAKEGLLFR LKGDGKRYSV MLTQDDGSKF RFSFNTTGGW QVIRMPFHKF VSEGKTSWGD 
DGDAILDLTR IEKIGVRFDA RKNQRETTMS DVMSGNNNMF NLTLEYVKAI PKGEEPDVIL 
VSCFGAGLEE GEEKERILKI KRDGERVLRN SGVGYTIVRP GELVEEAGGG KALVFDQTER 
INTPISCADV SDVCVKAMHD EEARNKSFDV GYEYESEQAE YELITQVKGK SDNYLTPALK 
VLEKNS