Gene OSTLU_28333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_28333
Symbol
ID	5006297
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009371
Strand	-
Start bp	234953
End bp	236566
Gene Length	1614 bp
Protein Length	360 aa
Translation table
GC content	63%
IMG OID	640421718
Product	predicted protein
Protein accession	XP_001422240
Protein GI	145356020
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0369] Sulfite reductase, alpha subunit (flavoprotein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.0642636
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.462802
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GACGCGCGCG ATGGCGCTCA CGGTGCGTCT CGCGCGCGAC GCGCGCGCGA CAAAAATATT 
CGCGCGCTCG ATCGCGTCGC CGTCGCGCGC GCGCGTAGGG ACGCGCGCGC GCGAACGGCG 
GGAAAAACGC GACGCGCGGC GATCGACGCG CGGCGATCGC GGGTCGACGG CGATCGCTTC 
GACGGGACGC GACGACGAAG GCGAACGCGC GCGAGACGCG CGCGGAGGAC TGACGAATGG 
AATGAAATCG TGCGATCGCT TCCACGAGCG CAGATGAACG TTTCCGCGAA GGTGCGCCGA 
GCGATGCGCG ATGGACCGAG CGGGCGGGCG ATCGGGCTTT GGAACCCGGC GAGACGCGAG 
GCGAGCGCGA CGCGCGCGAC GAGACGCGCG CGGAGGCGCG AGGGGGATGA ATGCGAAGGC 
GCGCGATGCG ATGCGCGCGG AGACTGACGA TGTGACGCGC GTGATGACGC GGTGCGATAG 
GTTTCCGCGT TCGCCGGCGC GAAGATCAAC GCGGCGCGCC AAACCAAGGC GCGCCGCGCG 
ACGGCGGTGG TGCGCGCCGA AGGCACGGAC TACGGTCTCG GCTTGCAGTG CTCGCCGACG 
GCGAACAAGA ACATCGACCC GAAGGGACGC GCGAAGGTGC CGCTCGAGCT CGAGGACATG 
CCGCTTCCGT TGAACACGTT CAAGAACAAG GAACCGTTCA CGGGTAAGGT GCGCTCCGTC 
GAGCGCATCG TCGGCCCGAA CGCGACTGGC GAAACGTGCC ACATCATCAT CGAACACGGT 
GGTAAGATGC CGTTCTGGGA AGGTCAATCG TACGGTGTCA TCCCGCCGGG TACCAAGGTG 
AACTCCAAGG GTAAGGAAGT GCCGCACGGC GTGCGCTTGT ACTCCATCGC GTCGTCCCGT 
TACGGCGACT CCTACGACGG CCAAACCGCG ACCTTGTGCG TTCGCCGTGC GACGTACTGG 
GATCCGGAAA TGAACGCCGA AGATCCGGCC AAGAAGGGCA TCTGCTCCAA CTTCTTGTGC 
GACGCCAAGC CGGGTGCCGA AGTCATGATG ACTGGCCCGA CTGGTCAAGT CATGCTCTTG 
CCGAAGGACC CGGCGACGCC GGTCATCATG GTCGCCACCG GTACCGGTAT CGCCCCGATG 
CGCTCCTACA TTCGCCGATT CTTCCTCGAA GACGTCCCGA ACTGGGAATT CAAGGGTCTC 
GCGTGGTTGT TCATGGGTGT CGCTAACTCT GACGCCAAGT TGTACGACGA CGAGTTCCAA 
GAGTGCGCCA AGCGTTTCCC GGATCAGTTC CGCATCGACT ACGCGCTCTC CCGCGAAGAC 
ACCAACAAGA ACGGTGGTAA GATGTACATC CAAGACAAGG TTGAAGAGTA CAAGGACCAA 
GTGTTCCAAC TCCTCGACGG CGGCGCTCAC ATGTACTTCT GCGGTCTCAA GGGTATGATG 
CCGGGCATCT TGTCCATGTT GGAAGGCGTG TGCAAGGAGA AGGGCATCAG CTACGAAGAA 
TGGCTCGAAG GCCTCAAGAA GAAGGGCCAA TGGCACGTCG AGGTGTACTA AGCGCCTTAG 
CCCGCGAATC GCAGCGTTTG GTTGATCCCT CAATGCGGAA ACGCGTTGAA GTTT

Protein sequence

MALTVSAFAG AKINAARQTK ARRATAVVRA EGTDYGLGLQ CSPTANKNID PKGRAKVPLE 
LEDMPLPLNT FKNKEPFTGK VRSVERIVGP NATGETCHII IEHGGKMPFW EGQSYGVIPP 
GTKVNSKGKE VPHGVRLYSI ASSRYGDSYD GQTATLCVRR ATYWDPEMNA EDPAKKGICS 
NFLCDAKPGA EVMMTGPTGQ VMLLPKDPAT PVIMVATGTG IAPMRSYIRR FFLEDVPNWE 
FKGLAWLFMG VANSDAKLYD DEFQECAKRF PDQFRIDYAL SREDTNKNGG KMYIQDKVEE 
YKDQVFQLLD GGAHMYFCGL KGMMPGILSM LEGVCKEKGI SYEEWLEGLK KKGQWHVEVY