Gene OSTLU_37787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37787
Symbol
ID	5005965
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	-
Start bp	3274
End bp	6486
Gene Length	3213 bp
Protein Length	1059 aa
Translation table
GC content	57%
IMG OID	640421386
Product	predicted protein
Protein accession	XP_001421937
Protein GI	145355372
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0369] Sulfite reductase, alpha subunit (flavoprotein) [COG4362] Nitric oxide synthase, oxygenase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	78
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGACG CTCGAACGCA GGTGTCCGTG GATCCGTACC CGGGATACGT GCACGGAAAG 
CGTCCCGCGG TGTGCCCGCG CGGGTGCGAG CCGTTGGAAG CGGCGAAGAC GAAGCGCGAG 
AGCGCGGGAA ACAAACTGAG AAGAGAAGCC GAAGAGTACG CGCGGTTGTA CGGTCACGAA 
CGAGGGATTG ATGAAAAGAT TACGGATGCA CGAGTAAAAC ACATACTCGA CTCCATCGAC 
ACCACGGGGA CGTATGCGCA CACGCTGGAC GAGATTCGTT GGGGCGCGCG AATCGCGTGG 
CGCAACGCGC CGAAGTGCAT TAATAGAAAA TTCTGGGCGA CGCTCGACGT CATCGACGCT 
CGAGACGCCG AGACGAACGA CGAGATGTTT GAGGCTATTA AGGAACACTT AAGGCGTGGA 
ATAGGCGGTG ATCACATTCC GGTGCTCATG ACGGTGTTTA AACCGCAGAC GCCGAACACC 
GAAGACGGAC CGCGCGTTTG GAATTCGCAA CTCATTCGAT ACGCGGGCCA TCGAGGACCG 
AACGAAACCA CAATCGGCGA CCCCGCAGAG TTGCACTTCA CCGACTCCGT GAAGAAGTAT 
TTCGATTGGG TACCGAAAGG CGGTGCGGAG ACTCCGTTCG ATCCGCTTCC GATTGTGGTG 
CAAATCAGTC CTTCGACGCC GCCGAGCATT TACGAACTTC CCGACGAGTG CTTGCTCGAG 
GTACCGATTC ACCACCCTAC GATTCCTGGC ATCTCGCAGC TCGGATTGCG CTGGTATGGC 
ATCCCAGCCG TGTCGAACAT CACGCTCGAT CTCGGTGGTT TGCATTACAC GGCCGCGCCC 
TTCAACGGTT GGTACATGGT GACTGAGATA GCGACGCGCA ACTTTTGCGA CGAGTCGCGA 
TATAATTTCG CGCCACGAAT TGCCAAAGCG ATGGGCATCG ACACGTCTAC GAACGAAACT 
TTATGGAAAG ATCACGCGCT CGCTGCGATA AATTACGCCG TTCTGTATTC TTTCAAGCGC 
GCGCGTGTGA GCATCGCTGA CCATCACACG TGCGCCGAAT CCTTTGCGCA GTGGTACGCG 
GATGAGATGA AAGATCGCGG CTATGCGCCT GGAAATTGGA AGTGGATCGT ACCCCCCACC 
GCGGCTTCGA CGTCTTCGAT TTATCTCGGC TTGAACAAGA TGACGGAGTA TACGCTGAAA 
CCGGCGCTCG TCGGCGGTAT GAGTCTGAAT CAACTCGTGA TTCGCGCGCG GCGCGCCAAC 
TTCTTCACCG CTTCTGGGCT GTCTCAAGCG GCGATGCACG TCGCCGTCGC GGCGGCGAAG 
TGGCGCAAGC GCATGGTGCG AGTAAAGGGA GCGCTTATTC TGTACGCTTC GGACGGAGGC 
CGCACGCAAG CACGCGCGTC ATGGCTGTGG TTGTTCTTGA GGCAAAGATT TCCGATGATT 
CGGCCAATCA ACGTCGCGAA TCCTGACCTG CGAAGTGACG ACCTTTTGAA AGCGCTCGAG 
CGCGTTGAAT TCGTAATCGT GCTCGCGTCG ACCACGGGGT CGGGGGCAGT TCCGACGGGG 
TCGGAAAGGT TCATCGAGTG GTGCCGTAGT GACGGAGCGC GCGAGGCGTT GAAAGACAAA 
AATTTCGCGT TGTGCGCGTT CGGCTCGCGC GCCTATCCAA AGTTTTGCGG CGGTGGCAAG 
CAGTTCGCGA TGGCACTCCG CGAAGCCGAC GCGAAAGAGA TGTTTCCTAT GGTTTGCGCC 
GATCAGCTCG AGGGTGAAGA CGCCAGCGTG CACGAGTTCA CGAAGAGTCT GTTCAATTGG 
TTCCACAAAC ACGAGCGCAT TACCGCGTCG CTGCGCGATC TTTTGACCAA TCAGCTTGTA 
AGCGGGGCGC GGCTTCAACC GTCGTTTGTC TTGAACGTGC GTCGCCGTGA CGTGCACGGA 
CGAGACCACA CGGCTGACCA TCGAGCAGGC GTGCCGGCGA CGTTAACCGA TCGAGTCGTG 
CTCGGCGACG GTAGTAGATT GAACACTGTC GCCGTGACAC TCACCTTACC GCGCGGGCAT 
CGAGACACCG AGTTTTACAA ACCCGGCGAT CATGTTTCAG TGTACCCTCG AACGAGCGAA 
GCGCGCGCGC GCTATTTCGT CGCGCACTTT GGCATCGACT TTGACGATCA AATCGAACTA 
GTTCCTCTGG ACGAATCAGA AATCTTTGAG AATTCACTCG ACTCGAGCAT TCCGAACCCA 
GTCGGTGCCG GTTATCTTTT CACTACGGTG CTGGATATCA ACAAAGAGCC ATCGGCGGAG 
TTGCTGCAAG CCCTCGCGCA TTACGTCGAC GACGAAACGT GCAAAGCACA AATGGAAAAC 
TTGGCACTCG ATGAAGACGC GCGGCGAGAG TGGATTTCGC AGACTGGCGC GCGGATATCT 
ACACTCTTCG ATCAATTTCC GACGTTGAGC GCGACGCATC GCCGTGACAA GGCGGTGGGC 
ATCGAAATGC TGCGAGACAT TCTTCTCAAG ATACCAAAAC TTCGCGCGCG TTATTACTCC 
GTCTCGAGCT CGCCGCGCGC CGTCGGAAAT AACGTGTTTT CTTTAACCGT CGGACGTGTG 
ACGTACAGGA ATGGCGACGG CGTGAATTCG CACATGCATC TCGGCTTCTG TTCTGATTTC 
TTGGCGACGT TGCCCTTGCG CACAAACGTC ATGGTCGAGA TGCTCCCGGC GCCGGCGTTT 
CGATTGCCGC GGTCTCCGAA GGTGCCGATT CTGATGATCG CTGGCGGGAC TGGGATAGCG 
CCCTTTAAGG GGTTCGTCGA TCATCGCGCG TGCATGGCGC CTGAACAAAG GAGCGACGCA 
TGGCTTATTG TGGGATGTCG AACGCGAGGA AATCAGTTGT ATCGCGACGA GATGGAAATC 
GCCGCCGAAA ATGGCGCGTT GACAGCGTAC CTCGTCGGGT ATTCTCGCGA GCCAGACTTG 
CCGAAAATGT ACGTCGACGC CGTGATGCGC GAGAACGGCG ACGGGATTCG CGATTTGATT 
AAAGGAGGCG GACACGTGTA CGTATGCGGG GACGTGCGAA TCGAGACGTC CGTGCGTGGC 
GCGCTCGATG ACATACTCGG TCGAGCCGAA GTGGAGTCGC TCGAAAAATC GGGTAGATAC 
CATCTTGATA TATTCGGCGC CTTCGACGTG CAGACGTCGC TGAATCAACA ACTCAAATCG 
GCGCGAAGGT CGCTTTCGTG TAGAAAGAAA TGA

Protein sequence

MIDARTQVSV DPYPGYVHGK RPAVCPRGCE PLEAAKTKRE SAGNKLRREA EEYARLYGHE 
RGIDEKITDA RVKHILDSID TTGTYAHTLD EIRWGARIAW RNAPKCINRK FWATLDVIDA 
RDAETNDEMF EAIKEHLRRG IGGDHIPVLM TVFKPQTPNT EDGPRVWNSQ LIRYAGHRGP 
NETTIGDPAE LHFTDSVKKY FDWVPKGGAE TPFDPLPIVV QISPSTPPSI YELPDECLLE 
VPIHHPTIPG ISQLGLRWYG IPAVSNITLD LGGLHYTAAP FNGWYMVTEI ATRNFCDESR 
YNFAPRIAKA MGIDTSTNET LWKDHALAAI NYAVLYSFKR ARVSIADHHT CAESFAQWYA 
DEMKDRGYAP GNWKWIVPPT AASTSSIYLG LNKMTEYTLK PALVGGMSLN QLVIRARRAN 
FFTASGLSQA AMHVAVAAAK WRKRMVRVKG ALILYASDGG RTQARASWLW LFLRQRFPMI 
RPINVANPDL RSDDLLKALE RVEFVIVLAS TTGSGAVPTG SERFIEWCRS DGAREALKDK 
NFALCAFGSR AYPKFCGGGK QFAMALREAD AKEMFPMVCA DQLEGEDASV HEFTKSLFNW 
FHKHERITAS LRDLLTNQLV SGARLQPSFV LNVRRRDVHG RDHTADHRAG VPATLTDRVV 
LGDGSRLNTV AVTLTLPRGH RDTEFYKPGD HVSVYPRTSE ARARYFVAHF GIDFDDQIEL 
VPLDESEIFE NSLDSSIPNP VGAGYLFTTV LDINKEPSAE LLQALAHYVD DETCKAQMEN 
LALDEDARRE WISQTGARIS TLFDQFPTLS ATHRHILLKI PKLRARYYSV SSSPRAVGNN 
VFSLTVGRVT YRNGDGVNSH MHLGFCSDFL ATLPLRTNVM VEMLPAPAFR LPRSPKVPIL 
MIAGGTGIAP FKGFVDHRAC MAPEQRSDAW LIVGCRTRGN QLYRDEMEIA AENGALTAYL 
VGYSREPDLP KMYVDAVMRE NGDGIRDLIK GGGHVYVCGD VRIETSVRGA LDDILGRAEV 
ESLEKSGRYH LDIFGAFDVQ TSLNQQLKSA RRSLSCRKK