Gene OSTLU_42345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_42345
Symbol
ID	5003274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	257895
End bp	258953
Gene Length	1059 bp
Protein Length	352 aa
Translation table
GC content	64%
IMG OID	640418695
Product	predicted protein
Protein accession	XP_001419325
Protein GI	145349820
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.252628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACG TCCGCGTCCT CGTCACCGGC GGCGCCGGGT ACATCGGCAC GCACGCGTGC 
GTGCAGCTCC TGCTCGCCGG CGCGTCCGTC GTGGCGATCG ATAACTTTGA CAATTCGTGC 
GCCGAGGCGG TCGAGCGCGT GCGCGCGATC GTCGGCGAGC GGCGCGCCGC GCGGTTGACG 
TTTCGCGAGT GCGATTGCCG CGACGCCGAG GCGCTGGAGG ACGTGTTCGC GACGTGCGGG 
ACGGTGCGCG CGGTGATCCA CTTCGCCGGG CTCAAGGCGG TGGGGGAGAG CGTGGCGAAG 
CCGCTGCTGT ACTATGAGAA TAACATTCGG AGCACGCTGA CGCTGTGCGA GACGATGGCG 
AGGCACGGAT GCAAGACGCT GTGCTTTAGC TCGAGCGCGA CGGTGTACGG GGAACCGGCG 
TCGGTGCCGT GCACGGAGGA TTTCCCGACG GCGGCGCTGA ATCCGTACGG ACGGACGAAA 
TTGTTCATCG AGCACATTCT GAGCGATTTG CAAAAGAGCG ACGGCGAGTG GCGAGTGGCG 
CTGTTGAGGT ACTTTAATCC GGTCGGCGCG CACGAGAGCG GAACGCTGGG GGAGGATCCG 
AAGGGGATTC CGAATAATTT GATGCCGTTC GTGCAGCAGG TGGCGGTGGG GCGAAGAGCG 
GAGTTGAGCG TGTTCGGAAA CGACTATCCG ACGAAGGACG GCACGGGACG ACGGGATTAC 
ATTCACGTCG TCGATTTGGC GGATGGGCAC GTCGCGGCGG TGAAAAAGCT CACCACCGAT 
CCTAACGCGG GGTTGATCAC CGTGAATCTC GGGACGGGGA CGAGCACGAG CGTGTTGGAG 
CTCGTCGCCG CGTTTGAAAA GGCGTCTGGG AAAAAGATTC CGTGCAAGAT GGTCGCGCGT 
CGCGAGGGCG ACGCCGCGGA GGTGTACGGC GCCACGCAAA AGGCGTTTGA AGTTCTCGGC 
TGGCGCGCCG AGCGCACTAT CGAAGACTGC TGCAAAGATC AGTGGAAGTG GGCGAGCGCG 
AATCCATACG GGTACCTGGG CAAGCCCGAC GACGAGTGA

Protein sequence

MDDVRVLVTG GAGYIGTHAC VQLLLAGASV VAIDNFDNSC AEAVERVRAI VGERRAARLT 
FRECDCRDAE ALEDVFATCG TVRAVIHFAG LKAVGESVAK PLLYYENNIR STLTLCETMA 
RHGCKTLCFS SSATVYGEPA SVPCTEDFPT AALNPYGRTK LFIEHILSDL QKSDGEWRVA 
LLRYFNPVGA HESGTLGEDP KGIPNNLMPF VQQVAVGRRA ELSVFGNDYP TKDGTGRRDY 
IHVVDLADGH VAAVKKLTTD PNAGLITVNL GTGTSTSVLE LVAAFEKASG KKIPCKMVAR 
REGDAAEVYG ATQKAFEVLG WRAERTIEDC CKDQWKWASA NPYGYLGKPD DE