Gene OSTLU_2171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_2171
Symbol
ID	5002273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	-
Start bp	479282
End bp	480685
Gene Length	1404 bp
Protein Length	468 aa
Translation table
GC content	63%
IMG OID	640417694
Product	predicted protein
Protein accession	XP_001418496
Protein GI	145348104
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0294] Dihydropteroate synthase and related enzymes [COG0801] 7,8-dihydro-6-hydroxymethylpterin-pyrophosphokinase
TIGRFAM ID	[TIGR01496] dihydropteroate synthase [TIGR01498] 2-amino-4-hydroxy-6-hydroxymethyldihydropteridine pyrophosphokinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.344916
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.14171
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCGCGC TCGGATCGAA TCAAGGCGAT CGCGTCGGGT TGTTTCGCGA CGCGTTCGCT 
AAACTCAGGC GTGACCTCGG TTTCGAGCTT CACGCGCATT CCTCGCTCTA CGAGACCGCT 
CCGGCGTACG TCGAGGACCA GGGGAAGTTT TTGAACGCCG CGTGCGTCGG ATCTTTTCCC 
GACGACGTCG CGCGAGATCC GCTGGCGCTG CTGGATGGGC TGAAAGCCAT CGAGGCGGCG 
CTGGGGCGAG ACTTCGGGAC GCGGCGGTAC GGACCGAGGC CGATGGATTT GGACGTCATA 
TTCCACGGGC AAGGCTCGCA TTCGTGCGAC AGATTGACGG TTCCGCACGC GCGCTACGCC 
GAGCGGCCGT TCGTGCTGGC GCCGCTCGCA GATTTGACGG GCGCAGCGAC GGCGGCGACG 
ACGAGCGACG CGACGACGGA AGGGCTGCTC GAGGCTCGGA GGATTTGGGA CGGCACCGAT 
GGAGAGGTTA CGGCGATGGA AAGTGGTGAT ATAGCGCGCG TGATCCCGAT GAGAGACAGA 
TTGTGGAGCT GGGGTCGAGA GACGATGGTG ATGGGTATTT TGAACGTGAC ACCGGATTCG 
TTTAGCGACG GCGGCGCGTA CGACGGCGGC GTGGACGTGG CTGTGCGACA CGCCAGGGAA 
ATGGTCGCCG CGGGGGCGAC GATAATAGAC GTTGGTGGGC AGTCGACGCG ACCAGGGGCG 
ACGAGGGTGA GTGGAGAAGT AGAGAGTTCG CGGGTGATCC CCGTCATACG CGCGCTCGCT 
CAAGCGTTTA GCGAAAGAGA AGACGTTTAC ATCTCTGTAG ATACGTTTTA TGGCGCCGTC 
GCGAGCGCGG CTGCGGATGC TGGGGCTGAC ATCATCAACG ATGTCAGCGG CGGAGCGTGG 
GACCCCGCGA TGCTACCGAC GGTGGCGCGT TTGGAGAAGC CTCTGCCGTA CGTCGTCATG 
CATGTTCGAG GCGATCCGAA CAGTATGCAG AGCGCGAAGA ACACGACGTA CGATGGGCAC 
ATTTGTGACG AGGTTGGTGA TGGTCTCTTA GCGACCGCAC GTCGATGTGT GGAGTACGGT 
ATAGAGCCAT GGCGTCTGTG GATTGATCCG GGCATCGGTT TCGCGAAGAC GGGTCGAGCC 
AACATCGAGC TGTTGCGAGA TTTGCCACGC GTCCGAAGCC GCTTAGCCCC CTTAGGCGGA 
GCGCTCATGA ACGCCCCGAT GCTCGTGGGT GCGTCTCGCA AACGTTTTCT CGGTGAGATA 
TCGGGAAGGT CCGAAGCGAG CGAGCGAGAC GCCGCGTCCG TGGCAGCGCT CGTCGCCGCC 
GTTAGAGGTG GTGCGGACGT CGTCCGAGTT CATAACGTCG CGCTGTCCGC GGACGCCGCG 
CGAGTAGCCG ACGCGCTGTG GCGA

Protein sequence

VLALGSNQGD RVGLFRDAFA KLRRDLGFEL HAHSSLYETA PAYVEDQGKF LNAACVGSFP 
DDVARDPLAL LDGLKAIEAA LGRDFGTRRY GPRPMDLDVI FHGQGSHSCD RLTVPHARYA 
ERPFVLAPLA DLTGAATAAT TSDATTEGLL EARRIWDGTD GEVTAMESGD IARVIPMRDR 
LWSWGRETMV MGILNVTPDS FSDGGAYDGG VDVAVRHARE MVAAGATIID VGGQSTRPGA 
TRVSGEVESS RVIPVIRALA QAFSEREDVY ISVDTFYGAV ASAAADAGAD IINDVSGGAW 
DPAMLPTVAR LEKPLPYVVM HVRGDPNSMQ SAKNTTYDGH ICDEVGDGLL ATARRCVEYG 
IEPWRLWIDP GIGFAKTGRA NIELLRDLPR VRSRLAPLGG ALMNAPMLVG ASRKRFLGEI 
SGRSEASERD AASVAALVAA VRGGADVVRV HNVALSADAA RVADALWR