Gene OSTLU_429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_429
Symbol
ID	5003456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	453996
End bp	456440
Gene Length	2445 bp
Protein Length	815 aa
Translation table
GC content	60%
IMG OID	640418877
Product	predicted protein
Protein accession	XP_001419385
Protein GI	145349941
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1501] Alpha-glucosidases, family 31 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0318632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.136701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTCGCGCTGG CGCTGACGAC GATCGTCGTC CTCGCGACGC GAACGGACGC GCTCAAAGCG 
AACGATTTCA AGACGTGCGC GACGAGCTCG TTTTGCGCGC GAGGGCGAGA CGCGCGAGAC 
GCGCGAGGCG CGAGGATCGA AGACGCGCGC GCGCGCGAGC GCGACGCGAG GGCGGTCGAG 
TTCGACGTCG TGCGCGGCGA TGAGGGAAGT GCGTCGCTGG TGGGTTCGGT GGAGGGGATG 
AAAACGGGCG CGGTGCGCGT GCGGGTGGAC GAAAGAGGCG AGCGGGCGCG ATTCGCGGCG 
CGGGAGGTGC TGACGAGGGA GACGGAATTC GAGGACGACG CGAGGGCGCG GGCGCGCGTG 
GTGGGAAGGA GCGAGACGAG CGTGGAGGTG GAGTTCGAAG AGACGGGGGC GCGGGCGAAG 
ATTTACGCGG ATCCGTTCAA AGTGGAGGTG TACGCGCGGG AGGCGACGAC GCCGGCGGCG 
ATTTTTAACG CGCGAGGCGA GTTCGCGTTC GAGACGGGAG GCGACGGGTC GTCGGAGGAT 
TGGGCGGAGA CGTTTAACGG GCACACGGAT ACGCGCAAGA ATGGACCCAC GGCGGTGGCG 
TTCGACCTGA CGTTTCCGAG CGCGAGCGAC GCGTACGGGC TTCCCGAACG CGCGACGTCG 
CTCAGCCTGA AATCGACGCG AAAGTACGAG AGCGGTAAGA GTTGGTTCGG TCGATCTTCG 
GTCGATTCGT CGGTGAATGA AACCACGCTC GGGGAACCTT ACAGATTGTA CAACCTCGAC 
GTGTTCGAGT ACCTCGATGA TAGCGCGTTC GGGCTTTACG GATCGATTCC GATGCTCACC 
GCGCACGGGG TCCGCGACGG CAAATCGACT ACGGCTGGCG CTTACTTTCA CAACCCGAGC 
GAGATGTACG TGGATGTCAA CGTCGACGGC GCTAACGGCG TGCACACGAA GTGGATGGCC 
GAGAGCGGCG CGATGGATGT TTTCATTCTC CCCGGCGATA CCCCCGCGGA TGTGTTGAAG 
CAATACACGG CGCTGACGGG CACGACGTCG ATGCCACCGT TATTTTCGCT CGGCTATCAT 
CAGTGCCGAT GGAACTATCG CGACGAGAAC GACGTCAAGG AAGTCGACGC CGGTTTCGAC 
GCAAATGACA TACCGTATGA CGTGCTTTGG CTCGACATCG AACACACCGA TGGGAAGCGG 
TACATGACGT GGGACAACGG TCCGTTCCCC ACGCCCGAAC GCATGATCAA CGACATCGCC 
AGTCGCGGAC GAAAGATGGT CACCATCGTG GATCCGCACG TAAAAATCGA CAATAATTAT 
CCCGTCTATA AAGAGGCAAA GGATAAAGGG TTTTACGTCA AGAAGAACGA CGGCACGACG 
GATTTTGACG GGTGGTGCTG GCCGGGAAGT TCGACGTACT TGGACGTCAC GAATCCAGAC 
GTTCGCGAGT GGTGGGCGAG CAAGTTTTCT TTGGACTCCT ACAAAGGATC GACGAAAGAC 
TTGTACATTT GGAACGATAT GAACGAGCCG TCCGTGTTCA ACGGTCCCGA AATTACGATG 
CAAAAAGACT TGATTCATCA CGGCGGCGTC GAGCATCGCG AAGTGCACAA CGCTTTCGGC 
ATGTACTACC ACATGGCCAC CGCGGAGGGC ATCAAGCGAA GAAACGACGG CGATCGTCCT 
TTTGTCCTCT CGCGCGCCTT TTTCGCCGGG ACGCAACGCA TCGGACCGAT TTGGACCGGT 
GATAACACCG CTGATTGGCG ACACCTCGCC GTGAGCTTAC CGATGGTGCT CACGCTCGGC 
GTGAGCGGGT TGACGTTTAG CGGCGCCGAC GTCGGAGGAT TTTTTGGCAA TCCCGACGCT 
GAGCTCATGA CGCGGTGGTA CCAAGTCGGC ACTTACTATC CTTTCTTTCG TGGACACGCG 
CATTTGGAGA CGAAGCGCCG CGAGCCTTGG TTGTTCGGTG ACGAGAGCAC GGCAATCATT 
CGTCAAGCGA TTCGCGAGCG ATACGCGCTC CTGCCTTACA TTTACACCTT GTTTGAAGAG 
TCGCACCGAA CGGGCGCGCC CGTGTTGCGT CCGCTTTGGT ACGAATTCCC AACGGATGAG 
AACGTGTTCA AGATTCAAGA TTCATTCATG CTCGGTTCGG CAATTTTAGT GCAGCCAGTG 
TTGAAGCAAG GCGCGAAATC CGTCTCGGTG TACCTTCCGG CTGGCGTTTG GTACGAAAAA 
CGATCGGGCG CGCGACACGT CGGACCGAAG ACGTTCGACG TCTCCGTCGA GCTCAGCGAC 
GTTCCGGTGT TCCTTAGAGG TGGTGCTATT TTCGTGCGAA AGGACAGAGC TCGGCGAAGC 
TCGACAGCGA TGAAGGGTGA CCCATTGACC ATCGTCGTCG CGCTCGACGC GAACGGCGAG 
GCGAGAGGCT CGTACTACGC CGACGACGGT AAGAGCTACG AGTAC

Protein sequence

LALALTTIVV LATRTDALKA NDFKTCATSS FCARGRDARD ARGARIEDAR ARERDARAVE 
FDVVRGDEGS ASLVGSVEGM KTGAVRVRVD ERGERARFAA REVLTRETEF EDDARARARV 
VGRSETSVEV EFEETGARAK IYADPFKVEV YAREATTPAA IFNARGEFAF ETGGDGSSED 
WAETFNGHTD TRKNGPTAVA FDLTFPSASD AYGLPERATS LSLKSTRKYE SGKSWFGRSS 
VDSSVNETTL GEPYRLYNLD VFEYLDDSAF GLYGSIPMLT AHGVRDGKST TAGAYFHNPS 
EMYVDVNVDG ANGVHTKWMA ESGAMDVFIL PGDTPADVLK QYTALTGTTS MPPLFSLGYH 
QCRWNYRDEN DVKEVDAGFD ANDIPYDVLW LDIEHTDGKR YMTWDNGPFP TPERMINDIA 
SRGRKMVTIV DPHVKIDNNY PVYKEAKDKG FYVKKNDGTT DFDGWCWPGS STYLDVTNPD 
VREWWASKFS LDSYKGSTKD LYIWNDMNEP SVFNGPEITM QKDLIHHGGV EHREVHNAFG 
MYYHMATAEG IKRRNDGDRP FVLSRAFFAG TQRIGPIWTG DNTADWRHLA VSLPMVLTLG 
VSGLTFSGAD VGGFFGNPDA ELMTRWYQVG TYYPFFRGHA HLETKRREPW LFGDESTAII 
RQAIRERYAL LPYIYTLFEE SHRTGAPVLR PLWYEFPTDE NVFKIQDSFM LGSAILVQPV 
LKQGAKSVSV YLPAGVWYEK RSGARHVGPK TFDVSVELSD VPVFLRGGAI FVRKDRARRS 
STAMKGDPLT IVVALDANGE ARGSYYADDG KSYEY