Gene OSTLU_18701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18701
Symbol
ID	5006184
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009371
Strand	-
Start bp	203570
End bp	204939
Gene Length	1370 bp
Protein Length	376 aa
Translation table
GC content	60%
IMG OID	640421605
Product	predicted protein
Protein accession	XP_001422230
Protein GI	145355999
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00776601
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGGCCG CCGGTGCGTG ACGACCTCGA GAACGAGGCG TGGGAATTTT TCGCGCCGCC 
CGCGGATCGC GCGGCGTCGC GCGCGGCGTC GCGCGACGCG CGACGCGCGC GAGTTATCCG 
ATGACGTGGG CGAGTGCGGA ACCCGGAAAC GGCGCGCGTG GCGGCGCGGT GCGGCGCGCG 
CGACGACGCG CGCGGGGCGG GAGGCGATGA TTTGGAGGGA AAATAATACT GACGATGTTT 
CGCCGCGCGC AGGGTACGAA TTGCGCGGGA TTTACGGCAC GGAGGAGTAC TGGCCGGAGA 
AGAAGCTGAA GATTTGCGTG ACGGGCGCGG GAGGTTTCAT CGGGTCGCAT CTCGCGAAAC 
GATTGAAAGA GGAGGGACAT CACGTCGTGG CGTGCGATTG GAAGCGCAAT GAACACATGG 
AAGAGGCGAT GTTCTGCGAT GAGTTCATCT TGGCTGATTT GAGGCTGTAC GAAAACTGTA 
AAAAGGTTCT CGAGGGGTGC GACCACTGCT TCAACCTCGC GGCGGACATG GGAGGGATGG 
GATTCATTCA GTCCAACCAC TCCGTCATCT TCTACAACAA CGTGATGATT TCCTTCAATA 
TGATGGAAGC GATGCGGGTG CAGGGCGTGA CGCGATGCTT TTACGCGTCG AGCGCGTGCA 
TCTACCCGGA GGGCACGCAG TTGAGCACGG AGATGCAAGA CGGGTTGAAG GAAGCGAGCG 
CGTGGCCGGC GCAGCCGCAA GACGCGTATG GTCTCGAAAA GCTCGCGAGC GAGGAAGTGT 
ACAAGCACTA CCAGCAAGAT TTTGGTATTC AGACGCGCAT CGGTCGATTC CACAACATTT 
ACGGTCCGTA CGGCACGTGG AAGGGCGGTC GCGAAAAGGC GCCGGCGGCG TTCTGCCGTA 
AGGCTGCGAC GGCTGAAAGC GAAGTCGAAA TGTGGGGTGA CGGTAAGCAA ACGCGCTCTT 
TCACCTACAT CGACGATTGC GTCGAGGGCA TCTTGCGTCT CACCAAGAGC GACTTCGCCG 
AGCCGGTGAA CATCGGTTCC GACGAAATGA TCTCCATGAA CGATATGCAA GCCATGACGT 
TGAAGTTCGC GGGCAAGGAC TTGCCAATCA AGCATATTCC GGGTCCGGAA GGTGTGCGCG 
GTCGCAACTC CAACAACGAA CTCATCAAGG AAAAGCTCGG TTGGGCGCCG TCTGTCAAGC 
TCGCGGACGG CTTGAAGGTT ACGTTTGAGT GGATCTCGAG CAAGATTGCC GAAGAGAAGG 
CCAAGGGTGT TGACACCGCC GCCGCTTTCG GTAAGTCCAC CATCTGTGGC ACGCAAGCGC 
CGACCGAACT CGGTCAGTTG CGCGCTGCGG ACGGCGACGA AAAGCTGTAA

Protein sequence

MAAAGYELRG IYGTEEYWPE KKLKICVTGA GGFIGSHLAK RLKEEGHHVV ACDWKRNEHM 
EEAMFCDEFI LADLRLYENC KKVLEGCDHC FNLAADMGGM GFIQSNHSVI FYNNVMISFN 
MMEAMRVQGV TRCFYASSAC IYPEGTQLST EMQDGLKEAS AWPAQPQDAY GLEKLASEEV 
YKHYQQDFGI QTRIGRFHNI YGPYGTWKGG REKAPAAFCR KAATAESEVE MWGDGKQTRS 
FTYIDDCVEG ILRLTKSDFA EPVNIGSDEM ISMNDMQAMT LKFAGKDLPI KHIPGPEGVR 
GRNSNNELIK EKLGWAPSVK LADGLKVTFE WISSKIAEEK AKGVDTAAAF GKSTICGTQA 
PTELGQLRAA DGDEKL