Gene OSTLU_93854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_93854
Symbol
ID	5006035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009370
Strand	+
Start bp	175758
End bp	176780
Gene Length	1023 bp
Protein Length	340 aa
Translation table
GC content	55%
IMG OID	640421456
Product	predicted protein
Protein accession	XP_001421863
Protein GI	145355219
COG category	[S] Function unknown
COG ID	[COG4318] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.00630097
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0600499
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATTCCG ACGCGGAGAG GGCGGGGAAG GATAAGGCGA CGAAGGGATC GAAAATGGTG 
ACGAGCGTGG CGGAGGAGGA GGAGGATGGA TTGGAGCACG TGTACGAGAA ATCGCGGTGG 
TTTGAGATTC GGGACGTGGT TCGCCCGACG CAGGTGGCGC TGGGGTGGGA TTGGACGTTT 
TATAAGCTCG CGAATTTTAA AGACGCCGAC AGCGCCAAGG CGTACATGGC TCGGAAACCG 
ATTCCGTACG TTAAATACCG AGGGTTGCGG TACGTGGTGG ATCATCATCA CACGCTCGCC 
GCGCTGAACC TGGCGGGTTG GGACATCGAC GTTTACATGG AAGAGATTTT TGAGTACGAC 
GACGACATCG GGGACGACAG GTTTTGGGGT AACATGGAGG GTAAAGGTTG GAGCTTCTGT 
TGGGATTCGG ATTACTCTCG CTTGTCGCAC GAATCTATCC CGAAATCGTT TGAACTGCAG 
GCGTTTAGAA ACGACATCTT TCGCTCGCTC GGGGGGTTCT GCCGGAAAGC CAAGCTCCTC 
AAGCGCGGCA AGATGCTCGA AGAAAAATTA TTTTTCGAGT TCCAGTGGGG ATACTTTTTC 
TGGCTCCATA GAAACGACGC TTACGCGCTC TGGCCGTCGT CACAACTGCA ACGCGGTTTT 
GACCGTCTGC TCGCTATGAT TGAGCAAACG GACGACAGCG AATACATCGG CGAGGGACAT 
CTTGAGGCGA GTCGTGACGT CGCAGACATG ATCTTTCTCT CGGACAAAGT TTTGCAACCG 
CTTTACGAAG TGCTCGTTGA GTACGTCGCG CCCCTGGCGT ACGCGTACGC CACCTTGCCC 
GACGACGCGC GCGTCGTCCA CGGTTTGAGA AAGAGATTCG GCCGCGAGAC TCTTCCCGGT 
TCCGTCATCA CCGGCCAGTT TGACTTCTTA ACCGAGCGTC AAAATTTCAC CATGCCCGAG 
GATGGGAAGA AGGACAAGTC TAAGGATGGA AAATCGAGCT CGAGCTCGAA GAAGAAGGAC 
TAA

Protein sequence

VDSDAERAGK DKATKGSKMV TSVAEEEEDG LEHVYEKSRW FEIRDVVRPT QVALGWDWTF 
YKLANFKDAD SAKAYMARKP IPYVKYRGLR YVVDHHHTLA ALNLAGWDID VYMEEIFEYD 
DDIGDDRFWG NMEGKGWSFC WDSDYSRLSH ESIPKSFELQ AFRNDIFRSL GGFCRKAKLL 
KRGKMLEEKL FFEFQWGYFF WLHRNDAYAL WPSSQLQRGF DRLLAMIEQT DDSEYIGEGH 
LEASRDVADM IFLSDKVLQP LYEVLVEYVA PLAYAYATLP DDARVVHGLR KRFGRETLPG 
SVITGQFDFL TERQNFTMPE DGKKDKSKDG KSSSSSKKKD