Gene OSTLU_37993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37993
Symbol
ID	5003948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	+
Start bp	586719
End bp	587744
Gene Length	1026 bp
Protein Length	341 aa
Translation table
GC content	61%
IMG OID	640419369
Product	predicted protein
Protein accession	XP_001420043
Protein GI	145351349
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.144035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGGTA AGCAATGCAA GGTTGCCATC AACGGTTTCG GCCGCATCGG CCGCAACTTC 
TTGCGATGCT GGCACGGACG CGCCAACACC ATGCTCGACA TCGTCGCCAT CAACGACTCG 
GGCGGAGTGA AGCAAGCGAG CCACTTGGTC AAGTACGACT CCGTCCTCGG CACGTTCGAG 
GCGGATGTCA AGATCATCGA CGACACGCAC ATCTCCATCG ACGGCAAGTC CATCGAGATT 
GTGTCTTCCC GTGACCCGCT CCAGTTGCCG TGGAAGGCTC TCGGCGTCGA CATCGTCATT 
GAAGGTACCG GCGTCTTCAT CGACACCCCG GGCGCCTCCA AGCACTTGAC CGCGGGCGCC 
AAGAAGGTTG TCATCACGGC CCCGGCCAAG GGTGACGACA TCCCGACCTA CGTCCTCGGT 
GTCAACGCCG ACCAGTACAA GAACACCGAC AAGATCGTCT CCAACGCGTC GTGCACGACC 
AACGGCCTCG CGCCGTTCGT CAAGGTTCTC GACGACCGAT TCGGCATCGT CAAGGGTTTG 
ATGACCACCA CGCACTCCTA CACCGGTGAC CAGCGCATTT TGGATGCGTC TCACCGTGAC 
TTGCGCCGCG CTCGCGCCGC CGCCTTGAAC ATCGTGCCGA CCTCCACCGG CGCCGCCAAG 
GCTGTCGCGC TCGTCTTGCC GCAACTCAAG GGCAAGCTCA ACGGCATCGC GCTCCGCGTC 
CCGACGCCGA ACGTGTCCGT CGTCGATCTC GTCATCCAAA CCTCCAAGAA GGTCACCGCC 
GACGAAGTCA ACGCCGCGTT CCGTGAAGAA GCCGCCGGCA AGCTCAAGGG TATCCTCGCC 
GTCGCCGACG AGCCGCTCGT GTCTTGCGAT TTCAAGTGCT CCGACGTCTC CACGTCCATC 
GACGCCGCGC TCACCATGGT CATGGGTGAC GACATGTTGA AGGTTGTCGC GTGGTATGAC 
AACGAGTGGG GCTATTCGCA ACGCGTAGTG GACTTGGCGG AATTATGCGC AGCAAACTGG 
GAATGA

Protein sequence

MKGKQCKVAI NGFGRIGRNF LRCWHGRANT MLDIVAINDS GGVKQASHLV KYDSVLGTFE 
ADVKIIDDTH ISIDGKSIEI VSSRDPLQLP WKALGVDIVI EGTGVFIDTP GASKHLTAGA 
KKVVITAPAK GDDIPTYVLG VNADQYKNTD KIVSNASCTT NGLAPFVKVL DDRFGIVKGL 
MTTTHSYTGD QRILDASHRD LRRARAAALN IVPTSTGAAK AVALVLPQLK GKLNGIALRV 
PTPNVSVVDL VIQTSKKVTA DEVNAAFREE AAGKLKGILA VADEPLVSCD FKCSDVSTSI 
DAALTMVMGD DMLKVVAWYD NEWGYSQRVV DLAELCAANW E