Gene OSTLU_5032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_5032
Symbol
ID	5003819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	473557
End bp	474684
Gene Length	1128 bp
Protein Length	376 aa
Translation table
GC content	63%
IMG OID	640419240
Product	predicted protein
Protein accession	XP_001419817
Protein GI	145350867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.127559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GCGCACGTCG CCCTGCTGCT CTGCGCGCTC GCGCCGACCG TCGCGGTCGT CGATCCCAAC 
GCCCAGATCG TCGCCGTGAG CACGCTGAGC GTCGTCGCCG GCGCGTACCG AAGCGTGCGA 
CCGGCGAGCG AGGGCTCGGG AGAGGTCATG ACCAAGGAAG ACGCGCAAAA GTTCCCTCTG 
CTCGGGTCGT GCGTGCTGTT CGGGGCGTTT CTGGCGTTCA AGTTTTTGCC CAAAAACGTG 
CTCGACGTGT GCGCGACGGC GTACTTTGGG ATGCTCGGCG TCGTGGCGAT GAGCGCGATC 
CTGACCCCGG TCGTGCACAA ATTTGCGTTC GGGGGACGCG AGCTCGTGAG CTACGAACTG 
TTTTCGGTGC CGGAGATGAA GTGGGTGAAC GGCGAGCGGT GGACGGCGGA GTGCACGCTG 
GCGGAGGCGG CGGCGGGCGT CGCGGCGTTG GCGGGAACGG CGGCGTACGT TCGTTCGCGT 
CATTGGTTGG CGAATAATGC GCTGGGAATG TCGTTTGCGC TGCAAGGAAT CGAGTATTTG 
ACGATTGATA GCGTGCAGAT CGGGTCAATC TTGCTCGCGG GGTTGTTCGT GTACGACGTG 
TTTTGGGTGT TTTGCACGCC GGTGATGGTG AGCGTGGCGC GGTCGTTCGA CGCGCCGATC 
AAGCTACTTT TCCCGCGAGT CGCCGCCAGT GCGATCGAGG GCGCTAATAG ACCGTTTAGC 
ATGCTAGGTC TGGGGGATAT CGTCGTTCCA GGGCTTTACG TGGCGATGAT TTTGAGGATG 
GACAACGCGA GACGCGCGGC GGCGCTCGAG CCGAGAAAGT CGCTCACGAG ATCGGCGTCC 
AAAAAAGCTG CGACCGCCTC TCGAACGGTC CGCGACGACG GAAAGACTGT GACAACGTAT 
TTCCCCGCCG TCGCGTTCGG CTATCTCGTC GGGATCGTCA CCACCATCGT CGTCATGAAC 
GTCTTTGACG CCGCCCAACC GGCGCTGTTG TACATCGTCC CGGGCGTCCT CGGCGCCACC 
TTCATTCGCG CCGCTCTGGC GAAAGAAGTC GGCGTGACGT GGAATTACTG CGAAGGATTA 
GAAGAGGCCC AGGCCGAGCG CGACGCCGCG GAAGCCAAGA CGAAGTCG

Protein sequence

AHVALLLCAL APTVAVVDPN AQIVAVSTLS VVAGAYRSVR PASEGSGEVM TKEDAQKFPL 
LGSCVLFGAF LAFKFLPKNV LDVCATAYFG MLGVVAMSAI LTPVVHKFAF GGRELVSYEL 
FSVPEMKWVN GERWTAECTL AEAAAGVAAL AGTAAYVRSR HWLANNALGM SFALQGIEYL 
TIDSVQIGSI LLAGLFVYDV FWVFCTPVMV SVARSFDAPI KLLFPRVAAS AIEGANRPFS 
MLGLGDIVVP GLYVAMILRM DNARRAAALE PRKSLTRSAS KKAATASRTV RDDGKTVTTY 
FPAVAFGYLV GIVTTIVVMN VFDAAQPALL YIVPGVLGAT FIRAALAKEV GVTWNYCEGL 
EEAQAERDAA EAKTKS