Gene OSTLU_49124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_49124
Symbol
ID	5000736
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	796419
End bp	797930
Gene Length	1512 bp
Protein Length	444 aa
Translation table
GC content	61%
IMG OID	640416157
Product	predicted protein
Protein accession	XP_001417060
Protein GI	145345099
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.469563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.18765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAGCG ACTTTTTCCT GCCGTCGATC GGCGGCGTCG AGCTCCACAT CTACGCCCTC 
GCCGCGAGAT TGCGCGCGCG CGGACACAAG GTGGTGGTGT ACACGCACGC GCATCCCGGA 
CGCGTGGGCG TGCGGTGGAT CACGCGCGGG ATCAAGGTGT ATCACGTGCC GAGGGTGGTC 
ATGTACGACA ACTGTACGTT TCCAAATTTT CTCGGCGGGT TCAAGTTATT TAGAAAGGTG 
CGACGACGAC GACGACGACG ACGACGACGG CGACGGCGAC GCGCGCGCGC GAAGTTTCTT 
TCGTTTCGTT CGCTCGTTCG TTTCGTTCGC GTCGACTGAC GCGCGAATTC TGATTCGAAT 
TAGACGTGCG TTCGCGAAGG CGTGACGCTG GTGCACGCGC ACCAAGGGTG CACGATGTCG 
CACGAGGGCA TACTGTACGC GCGAACGATG GGAATGAAGT GCGTGTTCAC CGATCACTCG 
TTGTTTGGTT TCGCGGACGT CGGGGCGATT CACACGAACA AGTTATTGGA CATGACGTTG 
GCGGACACGC AGCACGCGAT TTGCGTCAGT CACACGGCGA AGGAGAATAC GGTTTTGCGG 
AGCGGGTACT TGCTCGGGGG CGAGCCAGGT TTGGCGCCGG AGCGCGTGAG CGTCATCCCG 
AACGCCGTGG ACTCCGTGAG ATTCACGCCG GATGTGACGA AGCGGAAGAA AGGACGCAGG 
ACGGTGGTGG TGACGTCGAG ATTGATGTAT CGCAAGGGCG TGCATCTGTT GGCGGGGGTG 
ATTCCGCTCG CGTGCGCCGA GCACGACGAT TTAGATTTCC TAATCGCGGG CGATGGATCG 
ATGCGGAAGC ATTTGGAGAA GGCGATCGAA GATGCGGGTT TGACCGAGCG CGTCACCATT 
CTCGGGAGCG TGTCGCACGA CAAGGTCCCA GAAGTGCTTC GTCGAGGCGA CGTGTTCCTC 
AACGCCTCGC TCACGGAGTC GTTTTGCATC GCCGTCCTCG AAGCGGCGTC GTGCGGATGT 
CTCGTCGTCG CCACCGCGGT GGGAGGCGTT CCAGAGGTAT TACCAGAAGA TATCATGTTC 
TTAGCGAAGC CGGACGTGCA GTCCATCCTG GACGCTCTCG ACGAGTGTCT CGAAGCGCTC 
CCGCGCGCCG ATCCGTGGCG GATTCACGAG CGCGTCGAGG CGTTGTACAA CTGGGACGAC 
GTCGCCCATC GCGTCGAGCT CGCGTACGAC CGCGCGTACG ACACGTGGGA CACGTTCATG 
GGGCGTCTTT ACAGGCTGTA CCGCCGCGGC GTCGTGTTCG GAAAGATGTT GTGGTGCGTC 
GCGGCGGTGA CGTACCTGTG GTGGCGCGCT CTCGAGTTTT TCGAACCCGC GGCGAGCATC 
GAGCCCGCGC TCGCGCTCGA CGACGAGCGC TTCGACGTCG AGCGCTTCGA CGACGAGCGC 
GCGCTCGCGC GCGAGGAGTA ACGAACGATT CATCCTCCCT CTCCTAGATC TAGCCAGTCC 
ATCTATCCAT CC

Protein sequence

MLSDFFLPSI GGVELHIYAL AARLRARGHK VVVYTHAHPG RVGVRWITRG IKVYHVPRVV 
MYDNCTFPNF LGGFKLFRKT CVREGVTLVH AHQGCTMSHE GILYARTMGM KCVFTDHSLF 
GFADVGAIHT NKLLDMTLAD TQHAICVSHT AKENTVLRSG YLLGGEPGLA PERVSVIPNA 
VDSVRFTPDV TKRKKGRRTV VVTSRLMYRK GVHLLAGVIP LACAEHDDLD FLIAGDGSMR 
KHLEKAIEDA GLTERVTILG SVSHDKVPEV LRRGDVFLNA SLTESFCIAV LEAASCGCLV 
VATAVGGVPE VLPEDIMFLA KPDVQSILDA LDECLEALPR ADPWRIHERV EALYNWDDVA 
HRVELAYDRA YDTWDTFMGR LYRLYRRGVV FGKMLWCVAA VTYLWWRALE FFEPAASIEP 
ALALDDERFD VERFDDERAL AREE