Gene OSTLU_37471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37471
Symbol
ID	5001303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	+
Start bp	467307
End bp	468512
Gene Length	1206 bp
Protein Length	401 aa
Translation table
GC content	56%
IMG OID	640416724
Product	predicted protein
Protein accession	XP_001417253
Protein GI	145345515
COG category	[R] General function prediction only
COG ID	[COG1161] Predicted GTPases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.0357188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TGTTACGGGT GCGGCGTCGC GCTGCAGACG AAGGATGAAT CGATCGCGGG GTACGTCGAT 
GCGGCGGAGT ACGCGACGAA GGCGGTGCAC AGACATTACG ACATGATGCT CTGCGCGCGG 
TGCGCGGCGC TGAGCAACGG GAAATTCGTA AACGCGGTCG AGGGGCAGGG CGGGTTGAAA 
GCGGCGCCCG GATTGATCAC GCCGAAGCAG CTCAGAGATC AACTGAAACC GATCCGGGAG 
AAAAAGGCGC TGGTGGTGAA GGTGGTGGAT GTGACAGATT TTCATGGGAG CTTTCTGAAA 
AAGGTGAGAG ACGTCGTCGG CGGGAATCCG ATTCTCCTCG TAGTGACAAA GGTTGATTTG 
TTAGATTCGA AAACGGACCT CGATGCACTC GTGGAGTGGG TCGGGCGCGA AGCCGAGACG 
CGACGGCTTT CACTGGCGGG AATCGCGCTC GTGAGTTCTA GGAAAGGATC TGGGATGCGC 
GACGCCGTAC TACAGATGAT GCGCGAGCGA AACGGTCGCG ATGTCTACGT CCTCGGCGCC 
GCGAATGTTG GCAAAAGCTC ATTCATTCGG GCCGCGATGG ATGAGCTGCG ATCGGCTGGT 
AATTATTTCG CACCTTCTAA GCGACTTCCC GTGGCGAGTG CGATGCCAGG AACGACGCTC 
GGAGTGATAC CGTTGAAGGC GTTTGAGGGT AAAGGCATAT TGTTCGACAC ACCTGGTTTG 
TTCTTACATC ACAGACTGAA CTCTTTGCTC GGGCCTGATG ATCTTTCGAC GATGAAACTC 
GGCGCGTCAT TGAAAAAGTT CGTGCCAAAG ACGCCTGAAT GCGCCGAGCC GCCTGGGTTT 
GATTCTTTTC AAGGGTACTC GTTGTGTTGG GGTTCGTTCG TGCGCGTGGA CGTCGTGCGG 
TGTCCACCGA ACGTAGCTTT TTCGTTCTAC GGACCCAAAT CGCAGCGTGT GGATATCATC 
AAGACCTCGG ACGTTCCACC GACGACGCCT GGACAAGAAG AAGCGGCATT GCGCGTGGTG 
AATGAGATCG ACTTTGTACC GCCGACGAAC GTAGTCGGCC CTTTGGTCGA TCTTTCGGTG 
TCTGGTCTAG GGGGCTGGAT TCGCGTCGAA AAAACGGATA GTAGAGGCGA TGGTGCCATT 
CTGGCTCGTG TGTATGGTGT TCGTGGCTTA GAGGTTTTCG CTCGCGACGT CATGCCGACG 
CCTTGA

Protein sequence

CYGCGVALQT KDESIAGYVD AAEYATKAVH RHYDMMLCAR CAALSNGKFV NAVEGQGGLK 
AAPGLITPKQ LRDQLKPIRE KKALVVKVVD VTDFHGSFLK KVRDVVGGNP ILLVVTKVDL 
LDSKTDLDAL VEWVGREAET RRLSLAGIAL VSSRKGSGMR DAVLQMMRER NGRDVYVLGA 
ANVGKSSFIR AAMDELRSAG NYFAPSKRLP VASAMPGTTL GVIPLKAFEG KGILFDTPGL 
FLHHRLNSLL GPDDLSTMKL GASLKKFVPK TPECAEPPGF DSFQGYSLCW GSFVRVDVVR 
CPPNVAFSFY GPKSQRVDII KTSDVPPTTP GQEEAALRVV NEIDFVPPTN VVGPLVDLSV 
SGLGGWIRVE KTDSRGDGAI LARVYGVRGL EVFARDVMPT P