Gene OSTLU_31731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_31731
Symbol
ID	5001861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	-
Start bp	438867
End bp	440252
Gene Length	1386 bp
Protein Length	461 aa
Translation table
GC content	56%
IMG OID	640417282
Product	predicted protein
Protein accession	XP_001418015
Protein GI	145347099
COG category	[S] Function unknown
COG ID	[COG4399] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGGC GATTCCCGCG CGCGGTGACG CTCGCGGCGA CGACGTACGT CGCCGCGACG 
CTCGCGCTCG CGCGCTGGAC CGACGACGAC GACGGCGCGA CGCGTCTCCG GCGACGACTG 
CTCGCCGCTG ACTCGACCAC GCCGCTCTGG CGATACGCGC TCATCCCGTT CATCGCCGCC 
GCCGTGGGCT GGGGGACGAA CGTCGTCGCG CTGAAGATGA CGTTCTATCC GCTCGAGTTC 
TTCCCGGGGT TCTTGAGGTT TGCGCAAGTG AAAGGGCAGC CGTTCGGCGC GCTCGGCGGA 
TGGCAAGGGA TCATCCCGAG CAAGGCGGGA GAGATGGCGG AGATATTGGT CGATCTCATG 
ACGAAGAAAT TGATCGATAT CAAGGAAATT TTCACGAGGT TGGAGCCGAA AACGTTCGCG 
AGCATCATGG ATCCCGAGAT GCGGTGCGTG ACGGAGGATA TATTTGAGAC GGTGCTCGCG 
CGGGAGGCGC CGACGTTTTG GCAAGGATTG CCGAGAGTGG TGCGGGAGGA GATGGTCGCG 
GAGGCCATGG CGCAATCGAG TGGGTTGTTG GAAGACATAA TCGCGGATTT GATGGAAAAT 
GTGTACGACG TGCTGGATTT GAAGACGATG GTGGTGACGC TGGCGGTGAA TAATAAGGAC 
AAGGTGGTCA ACATGTTTCG AGAAGTCGGC GCGAATGAGT TCGTATTCAT CGAGCGGAGC 
GGGATTTACT TTGGTTTTGC GTTTGGTTTG GTGCAGATGG TGGTGTTTTA CTTTGTCGAC 
AAGCATGCTC CGGAGCAGGG AGTGTGGTTG CTTCCATTTT TCGGATTCGC CGTGGGCTAC 
CTCACGAATT TCGTCGCGTT GAAGGTGATT TTCCAGCCAA TCGAGCCAAA GCGCGTGTGC 
GGCGTCACGT TGCACGGCGT GTTTTTGAGG CGCCAAAACG AAGTGAGCGA AGAGTTTGCG 
CGCTTGAATC AACTTCACTT TTGCAACGCC GAGAACTTGT GGGAAGAGAT GATGAACGGA 
ACGTACAAGG AAAAGTTTGA AGCCCTCGTG CGACGAAACG CCGAAAACTT TTTTGATAAA 
GCCATCGGCT CGGTGACGAC GGCAAAGCTC ATCATCGGCG CGGAAAAGTA TGACGAAATC 
AAGTGCACCA TCGTAGACAT GATTTTTGCT TCGATTCCCG ATTGCGTGCC CGTGACATAC 
GATTATCAAA ACGAAGCGCT CGGCATCGAG GATACGGTGC GCGAGCGAAT GCAAAAGCTT 
CCTGCAAAGG ATTTCGAGCG CGTTTTGCAT CCGGTTTTCG AGCAAGACGA AATCAAACTC 
ATCGTCGTGG GTGGGGTATT AGGCGCTTTG ACGGGCGTAG CGCAGTATTT CTTAGCGTTC 
GCATAG

Protein sequence

MRRRFPRAVT LAATTYVAAT LALARWTDDD DGATRLRRRL LAADSTTPLW RYALIPFIAA 
AVGWGTNVVA LKMTFYPLEF FPGFLRFAQV KGQPFGALGG WQGIIPSKAG EMAEILVDLM 
TKKLIDIKEI FTRLEPKTFA SIMDPEMRCV TEDIFETVLA REAPTFWQGL PRVVREEMVA 
EAMAQSSGLL EDIIADLMEN VYDVLDLKTM VVTLAVNNKD KVVNMFREVG ANEFVFIERS 
GIYFGFAFGL VQMVVFYFVD KHAPEQGVWL LPFFGFAVGY LTNFVALKVI FQPIEPKRVC 
GVTLHGVFLR RQNEVSEEFA RLNQLHFCNA ENLWEEMMNG TYKEKFEALV RRNAENFFDK 
AIGSVTTAKL IIGAEKYDEI KCTIVDMIFA SIPDCVPVTY DYQNEALGIE DTVRERMQKL 
PAKDFERVLH PVFEQDEIKL IVVGGVLGAL TGVAQYFLAF A