Gene OSTLU_10204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_10204
Symbol
ID	5001842
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	+
Start bp	363030
End bp	364088
Gene Length	1059 bp
Protein Length	337 aa
Translation table
GC content	61%
IMG OID	640417263
Product	predicted protein
Protein accession	XP_001417747
Protein GI	145346545
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.110736
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTCGCGGCGC CGCTCGCGCT CGAGAGCGGT GACGCGCTCG ACGCGTGCGA CGTCGCGTAC 
ACGGTGTACG GCGAGCTGAA CGCGAATAAA GACAACGTCG TGCTCGTCGG ACACTCGCTG 
ACGTCGAACA GTAACGTCGG CGAGTGGTGG GGGGAGGTGC TGGGCGAGGG CGACGCGTAC 
GCGCTGAACT CGAGGGAGGA TTGCGTGATT TGCGTCAACT ATCTGGGCTC GCCGTACGGA 
AGCGCGAGCC CGGTGAGCGC GGATCCGAGA AAGGAGGATC GCGGGGCGTA CGGGGTCGAT 
TTTCCGACGC CGGTCACGGT GAGGGATAAC GCGGTGATGT GCATGATGCT GCTGAGGGAG 
CTCGGGGTGA ACGGGGTGCG GTGCGCGATG GGCGGGTCGA TGGGTTCGAT GCTGGCGCTG 
GAGTTCGCGG CGACGTATCC GGATTTCGTA AAGGAGATAA TCATCATCGC CGGGTGCGGA 
CGACACACGG ATTGGGCGAT CGGCATAGGG GAGGCGCAAC GGTACGCGAT CATGAGCGAT 
GGGAAGTATA AGGGTGGGGC GTACGAGCGC GATCAAGGGC CGAACGCGGG GTTGGCGACG 
TCGCGAATGA TGGCGATGCT GAGCTATCGC GCGCCGGCGA GCGTCGATGG GAGATTTTCG 
CGTTCGAACA TGGGAGACGT CGCGAGACCG GCGGAAGAAC CCGAGCTAGG TGTGCGCGCG 
CACGAAAAGG AGACTAAGTT GCCGTATTTT GCGGTGGAGT CGTATCTGCA GTATCAAGGG 
AAAAAGTTTA TTCGCAGATT CGACGCGAAC TGCTACATTC AGTTGACGTA CACACTGGAC 
TCGCACGACG TCTCGCGTGG GCGAGGGGAT TATTTCGATG TGCTGGCAAA TATTAAACAG 
CGCGCTCTCG TCGTGGGTAT TCTCAGCGAC GTACTGTATC CGTATGCGCT TCAGCGCGAG 
CTCGCCGACG CGTTGCCGAA TTCGCAGCTG TACACCATAG ACTCCCCGCA CGGCCACGAC 
TCGTTCTTGA TCGAGATCGA GCAACTCAAC GCCGTCATG

Protein sequence

LAAPLALESG DALDACDVAY TVYGELNANK DNVVLVGHSL TSNSNVGEWW GEVLGEGDAY 
ALNSREDCVI CVNYLGSPYG SASPVSADPR KEDRGAYGVD FPTPVTVRDN AVMCMMLLRE 
LGVNGVRCAM GGSMGSMLAL EFAATYPDFV KEIIIIAGCG RHTDWAIGIG EAQRYAIMSD 
GKYKGGAYER DQGPNAGLAT SRMMAMLSYR APASVDGRFS RVRAHEKETK LPYFAVESYL 
QYQGKKFIRR FDANCYIQLT YTLDSHDVSR GRGDYFDVLA NIKQRALVVG ILSDVLYPYA 
LQRELADALP NSQLYTIDSP HGHDSFLIEI EQLNAVM