Gene OSTLU_33239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33239
Symbol
ID	5003213
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	606887
End bp	608623
Gene Length	1737 bp
Protein Length	452 aa
Translation table
GC content	62%
IMG OID	640418634
Product	predicted protein
Protein accession	XP_001419217
Protein GI	145349600
COG category	[Z] Cytoskeleton
COG ID	[COG5023] Tubulin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00514267
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.249426
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TCCGGCGCGC CATCGCAGCG ACCTCATCTC GCTCGACGCC CGCTCGATCG ACCGCATCGC 
GCCGACCGCA TCGCGCGACT TCCAGCGTTC CAACGACTTT GAATTCTTCG CCGAGACGAC 
ATGCGCGAGG TGATCTCCAT TCACATCGGT CAAGCCGGGG TGCAAACCGG GAACTCGTGC 
TGGGAGTTGT ACTGCCTCGA ACACGGGATC CAGCCGGAGT GCGTCGAGCG AGAGGCGACG 
CGACGCGACG CGATGGACGC GATGGATGTC GGGATCCGCG GGCGCGACGC TCGCGGGTTC 
GGGCGGGTGG TTCAGGGATA GCGCGACGCG CGCGCGACGC CGAAAATAGC GCCGCTTTCG 
TTGACCGAGC CGAGCGACTG ACTGATTGAC CGATTTCGAT CGCCAGTGGG CAAATGCCGA 
GCGACAAGAC GATCGGGGCG TCTGATGACG CGTTCAACAC GTTCTTCTCC GAGACCGGCG 
CCGGGAAGCA CGTGCCGCGA TGCATCTTTC TCGATCTCGA GCCGACGGTG ATCGACGAGG 
TGCGCACGGG GGCGTACCGT CAGCTGTTCC ACCCCGAGCA GTTGATCTCG GGCAAGGAAG 
ACGCCGCGAA TAACTTTGCG CGCGGTCACT ACACGATCGG CAAGGAAATC GTGGACTTGG 
CCCTCGATCG CATTCGTAAG TTGGCGGACA ACTGCACGGG TTTGCAAGGC TTTTTGGTCT 
TCAACGCCGT CGGCGGCGGC ACGGGTTCGG GTCTCGGCTC GTTGCTCCTC GAGCGCTTGT 
CCGTGGATTA CGGCAAAAAG TCCAAGCTCG GGTTCACCAT CTACCCCTCG CCGCAAGTCT 
CCACCGCGGT GGTGGAGCCG TACAACTCTG TGCTGTCCAC GCACGCGCTG CTCGAGCACA 
CCGACGTCGC GGTGATGTTG GACAACGAAG CCGTGTACGA CATCTGCCGC AGGTCTTTGG 
ACATCGAGCG CCCGACGTAC ACCAACTTGA ACCGCTTGAT CGCGCAGGTC ATCTCTTCGC 
TCACCGCGTC TCTGCGATTC GACGGCGCGT TGAACGTCGA CGTCACGGAA TTCCAAACCA 
ACTTGGTGCC GTACCCGCGC ATTCACTTCA TGTTGTCGAG CTACGCCCCG GTGATCTCCG 
CCGAGAAGGC GTACCACGAG CAGTTGTCCG TCGCGGAGGT GACGAACAGC GCGTTCGAAC 
CGGCGAGCAT GATGGCCAAG TGCGACCCGC GTCACGGCAA GTACATGGCG TGCTGCTTGA 
TGTACCGCGG CGACGTCGTG CCCAAGGACG TCAACGCCGC CGTGGCGAGC ATCAAGACCA 
GGCGCACGAT TCAATTCGTC GATTGGTGCC CGACCGGGTT CAAGTGCGGG ATCAACTACC 
AACCGCCGAC CGTCGTGCCG GGTGGCGATC TCGCCAAGGT GCAACGCGCC GTGTGCATGA 
TTTCCAACTC GACGGCCATC GCCGAAGTGT TTTCGCGACT CGACCACAAG TTTGACTTGA 
TGTACGCGAA GCGCGCGTTC GTGCATTGGT ACGTCGGCGA GGGCATGGAG GAGGGCGAGT 
TCTCAGAGGC ACGGGAAGAT CTCGCGGCGC TTGAAAAAGA TTATGAAGAA GTTGGATCAT 
CATCGCAATC TGGTGTTTCA GATTTTGTCG AAGAGACGGA GTACTGAGCC CGCGGCGCCG 
TCGCACTGTC GCGCATGCAC CGCTCGAGGC ACTGACTCGC GGTGACGCGC CACCACT

Protein sequence

MREVISIHIG QAGVQTGNSC WELYCLEHGI QPDGQMPSDK TIGASDDAFN TFFSETGAGK 
HVPRCIFLDL EPTVIDEVRT GAYRQLFHPE QLISGKEDAA NNFARGHYTI GKEIVDLALD 
RIRKLADNCT GLQGFLVFNA VGGGTGSGLG SLLLERLSVD YGKKSKLGFT IYPSPQVSTA 
VVEPYNSVLS THALLEHTDV AVMLDNEAVY DICRRSLDIE RPTYTNLNRL IAQVISSLTA 
SLRFDGALNV DVTEFQTNLV PYPRIHFMLS SYAPVISAEK AYHEQLSVAE VTNSAFEPAS 
MMAKCDPRHG KYMACCLMYR GDVVPKDVNA AVASIKTRRT IQFVDWCPTG FKCGINYQPP 
TVVPGGDLAK VQRAVCMISN STAIAEVFSR LDHKFDLMYA KRAFVHWYVG EGMEEGEFSE 
AREDLAALEK DYEEVGSSSQ SGVSDFVEET EY