Gene OSTLU_45442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_45442
Symbol
ID	5001363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	438729
End bp	440082
Gene Length	1354 bp
Protein Length	430 aa
Translation table
GC content	55%
IMG OID	640416784
Product	predicted protein
Protein accession	XP_001417504
Protein GI	145346039
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1501] Alpha-glucosidases, family 31 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.000628338
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCTCGTCGG TTGGGTATCG CCTAAGCATG CGCACGCAAC GCGAAGACAC ATGCGCGTGG 
CGCTGTGTGC GAACAAGAAC GTCAAATTGG CGACGATCAA CGTCCACAAG ACTCTGCATA 
AACCGAAAGC AGCTCCGCCC TCGGAAGTGT TTCGAGCCCC GATTTGGACG ACATGGGCGA 
AGATGAAGAC GAACGTTTCG CAAGAAAAGG TTTTGAGCTT CGCGCAAGAA ATTCTTGCGA 
ACGGTATGAG CGCCAGCGTC ATCGAGATCG ATGACAAGTG GCAGTGTGGG TACGGTGATC 
TCGATTTTGA CGCCACAAAG TTCCCAGATC CGAGTTCGAT GGTGGACGAG CTTCACGCCA 
TGGGCTTCAA AGTGACGGTG TGGGTCATGC CGTTCATCGC CGAAGATACA ATGGCGTACA 
GAGAAGGGAA GGACAAGGGT TACTTTGTCA ATTCGAACAC GCGAAATGGT TTCTTCAGGT 
GGTGGCAAAC GCCGCCAGTC GTCGCGTTAG ACGTCACAAA CCCGGAGGCG GTTGATTGGT 
TTGTATCTCG GTTGAAGCGT CTGCAAGAAA AGCACGGTAT CGACGGCTTC AAGTTTGACG 
CCGGTGAACC ATGCTTTTTG CCGCGAAGAT TCATCACACA CACACCTCTT TCGCACCCAT 
CAGAGTACAC GAGAGCGTGG GTGAACAACG TCGCTTCAAA GTTCGAACTT GCAGAAGTTC 
GAAGCGGTCA TAACAGCACA GGGAATTCTT CCCTCGTCCG CATGGGCGAT AGATTCTCCG 
ACTGGGGCAT TGAGAACGGG CTAGGGTCGA TTATTCCCGC GCTGCTTACA TCTGGCGTGC 
TTGGGTACCC GTTTTGTTTG CCAGACATCA TCGGTGGAAA CGCTTATTTT GGCAAACACC 
CGGACGAAGA GCTCCTCGTG AGGTGGGCGC AAGCCAACGC GCTGATGCCG GCGATGCAGT 
TTTCCCTCAC TCCTTGGGCC GCAGGTAGCA TGGCGAAAGA CTTATGCATC TCCGCATTGG 
AGATGCGCGA TCAGTTCGTG GAGACCCTCA TCGATCACAG CGAACGCGCG GTCGAAACGC 
TCGAACCCAT CTGTCGTCCG ATGTGGTGGC TCGATCCCGA GGATAGCGAA ACGTTCCGCA 
TAGGAGATCA GTTCGCGCTC GGCGAAGATA TCATCGTCGC CCCCGTCACC ACGCGAGGCG 
CGAATGAGAG AGCGATTTAT TTGACCGAGG GTCGATGGCG CGATTTATCT AATGGCAAGG 
TCCACCAGGG TCGGCGTTGG ATGCGCGATT TCTCCGCCCC GATCGGCGCG CTGCCCATTT 
TCATTCGCGA AAAGTCGTCG TAACGTCGAA GATT

Protein sequence

MRVALCANKN VKLATINVHK TLHKPKAAPP SEVFRAPIWT TWAKMKTNVS QEKVLSFAQE 
ILANGMSASV IEIDDKWQCG YGDLDFDATK FPDPSSMVDE LHAMGFKVTV WVMPFIAEDT 
MAYREGKDKG YFVNSNTRNG FFRWWQTPPV VALDVTNPEA VDWFVSRLKR LQEKHGIDGF 
KFDAGEPCFL PRRFITHTPL SHPSEYTRAW VNNVASKFEL AEVRSGHNST GNSSLVRMGD 
RFSDWGIENG LGSIIPALLT SGVLGYPFCL PDIIGGNAYF GKHPDEELLV RWAQANALMP 
AMQFSLTPWA AGSMAKDLCI SALEMRDQFV ETLIDHSERA VETLEPICRP MWWLDPEDSE 
TFRIGDQFAL GEDIIVAPVT TRGANERAIY LTEGRWRDLS NGKVHQGRRW MRDFSAPIGA 
LPIFIREKSS