Gene OSTLU_19724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_19724
Symbol
ID	5004318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	-
Start bp	103122
End bp	104238
Gene Length	1117 bp
Protein Length	371 aa
Translation table
GC content	68%
IMG OID	640419739
Product	predicted protein
Protein accession	XP_001420414
Protein GI	145352138
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GATGACGCGC GAACGCGCGC CGACGACGGC GACGCTGGAG GCGCTGCGAC ACCTCGTGCG 
CGCGGCGAAG GAAGACAGCG CGATCCTGGA CGCGCCGGCG CTCGAATTCT TCCGACGATG 
GCTCGAGGAG GATTTGGGGG CGACGATTCC GGCGCCGCGG ACGACGACGA CGACGGGGAC 
GGGGACGGAC GCGATCGAGA TCGAGGACGA CGAGGCGATG GCGGCCGAGA GCGATGATCT 
GAGCGCGATC GCGATGGGGG CGGAGACGGC GCCGGAGACG CTCGGGGAGG CGGAGGAGGC 
GAAGGCGAGC GAGGCGAAGC GACTGGCGAG CGAGGCGTTC GCGCGCGAGG CGTGGGAGGA 
GGCGATCGAG AGGTACACGG AGGCGCTGAT GATCGCGCCG TCGGCGCTGA CGTACGCGAA 
ACGGGCGGAA TGTTTCATCA AGTTGCGAAA GCCGCTGTCG GCGATTCGAG ACGGGACGGC 
GGCGTTGAAG TTGAATCCGG ATTCGGCCAA GGCGTTGAAG GTTCGAGGCG CGGCGCACAG 
GTACTTGGGA CACTGGAACG AGGCCAACGC GGATCTGAGC GCGGGATTGT CTCAGGACTT 
CGACGAGACG TACGGGGAGA TGCATAAAAA AGTCTTGAGC GTCGTGCACG AGCTTCACGT 
GCGCGAGGGC AAGGCGCGCG CCGCGAAGGA GGCCAAGGAA AGAGAAGAGC TCGAAAAACG 
CCGAGCCGCC GCGGAGGCGG CGCGCAAAGA AGCCGCGGCG AAAGACGCCG GCGGGCCTGG 
GTTCGGCCAA CCGGGCGCCG GATTCCCGGG CGGCGCCGGC GACTTGCCGC CCGGCGTTTC 
GCCCGAGATG GCGCAAAAGC TGATGAGCGA CCCCGATCTC ATCGCCGCGA TGCAGAACCC 
CAAGGTCATG CAAGCGCTTC AAACGATGAT GAAGAACCCG ATGGCGGCGA TGCAGTACAT 
GAGCGACCCC GAAGTCGGAC CGGTGTTGCA AAAATTGATG GCTTCGATGG GCGGCGCGAT 
GCCGGGCGGC GCGCCCGGCG GCTTCCCGGG CGGCTTCCCG GGCGGCTTCC CGGGCGCCGG 
CGCCGCGCCC GGCGGCGCGG CGAACGACGT GGATTAG

Protein sequence

MTRERAPTTA TLEALRHLVR AAKEDSAILD APALEFFRRW LEEDLGATIP APRTTTTTGT 
GTDAIEIEDD EAMAAESDDL SAIAMGAETA PETLGEAEEA KASEAKRLAS EAFAREAWEE 
AIERYTEALM IAPSALTYAK RAECFIKLRK PLSAIRDGTA ALKLNPDSAK ALKVRGAAHR 
YLGHWNEANA DLSAGLSQDF DETYGEMHKK VLSVVHELHV REGKARAAKE AKEREELEKR 
RAAAEAARKE AAAKDAGGPG FGQPGAGFPG GAGDLPPGVS PEMAQKLMSD PDLIAAMQNP 
KVMQALQTMM KNPMAAMQYM SDPEVGPVLQ KLMASMGGAM PGGAPGGFPG GFPGGFPGAG 
AAPGGAANDV D