Gene OSTLU_33121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33121
Symbol
ID	5003216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	423194
End bp	424300
Gene Length	1107 bp
Protein Length	368 aa
Translation table
GC content	59%
IMG OID	640418637
Product	predicted protein
Protein accession	XP_001419158
Protein GI	145349475
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.752316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.13405
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACTCT CCGACGGCGT CGTCGACGCG CGGAGCGACA CGGTGACGAA ACCGACGGCG 
CGCATGAGGG AAGCGATGGC GCGCGCCGAG GTCGGGGACG ACGTCCTCGG CGACGATCGC 
ACGGTGAAGG CGCTCGAACG TAAAATGGCG GAGATGTTTG GATTCGAGGC GGCGGTGTTC 
ACGCCGAGCG GAACCATGGC GAATTTGCTC GCCATCGCCA CGTGGTGCGA CGAGCGAGGG 
AGCGAAGCGA TCATCGGAGA TAAGTCGCAC GTGCACCTGT ACGAACAGGG CGGGATGTCG 
TCGCTGATGG GGGTGCATTC GAGAACGCTC AAGAATCGCG AAGACGGGAC GCTCGCGCTG 
GAGGATATAC GAGCCGCGAT ACGCACCGTG AGCGACGATC ACTTCCCAGT GACGAAGGTT 
GTGACGCTGG AGAACACGCA GAATAAGTGT GGGGGGAAGG TACTGCCGGT GGAGTACGTT 
CGGGAGGTTG GGGCGTTGTG CGCGGCGCAC GGGGTGAAGT TGCACATGGA CGGGGCGAGA 
ATTTGGAACG CGTTGGCGGC GAGCATCGAT CACGTTCGCA TCGATCACAT CTTACAAGGG 
TGTGATTCGG CGAGTATCTG CTTGAGCAAA GCCATCGGCG CCCCCGTTGG GAGCGTGTTA 
CTCGGCGATG AGGCGTTTGT TCGAAAGGCG AAGCGGTTGC GCAAAGCGTT GGGCGGTTCG 
ATGCGACAAG TCGGCGTCTT AGCCGCTGCG GCTTTAGAGG CGATCGATGA AGTATTCCCG 
AAGATAGCAG AAGATCACGA GCGCGCGAGG GCTTTCGCGA ACGCGCTACA AGGCGCGACT 
GGTCTCGAAT GCGCAACGCC GGAGTCGAAC CTCGTTCTCG TGCGAAGCAC CATTCCCGGC 
ATCACTTCCG AGATGTTGAT GCGGGAATTG GAGATGAGCC ACGGTGTGTT GGTTTTACCA 
ACGAATCAAG ACACCATTCG CGTCGCTTTT CACCATCAAA TCACGGATGC GGGCGTTGAA 
CGTCTGGTCA GTGGCTTTCG TGAAAGCGTG CTCGAACTCG CTCGCGACCC AAAGCTGAAC 
GAAATTATGA TGTCTGACGG TATGTAA

Protein sequence

MRLSDGVVDA RSDTVTKPTA RMREAMARAE VGDDVLGDDR TVKALERKMA EMFGFEAAVF 
TPSGTMANLL AIATWCDERG SEAIIGDKSH VHLYEQGGMS SLMGVHSRTL KNREDGTLAL 
EDIRAAIRTV SDDHFPVTKV VTLENTQNKC GGKVLPVEYV REVGALCAAH GVKLHMDGAR 
IWNALAASID HVRIDHILQG CDSASICLSK AIGAPVGSVL LGDEAFVRKA KRLRKALGGS 
MRQVGVLAAA ALEAIDEVFP KIAEDHERAR AFANALQGAT GLECATPESN LVLVRSTIPG 
ITSEMLMREL EMSHGVLVLP TNQDTIRVAF HHQITDAGVE RLVSGFRESV LELARDPKLN 
EIMMSDGM