Gene OSTLU_39224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_39224
Symbol
ID	5004755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009366
Strand	-
Start bp	255346
End bp	256878
Gene Length	1533 bp
Protein Length	510 aa
Translation table
GC content	56%
IMG OID	640420176
Product	predicted protein
Protein accession	XP_001420799
Protein GI	145352956
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0161526
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCCAG AGGCAAAAGA TTCGGACGTG GCGCGAGAGG CGTGGTACGT GCGAGCGATT 
TTGACCGCTG ATGTGTACGA TGTCGCGATC GAGTCCCCGC TTGAGCTCGC CCCGCGATTG 
AGCGATCGGG TCGGGGCGCA AATTTATCTC AAACGAGAAG ACTTGCAGCC GGTGTTTTCG 
TTTAAGATTC GAGGGGCGTA CAATAAGATG AAGCAATTGA CGGAAGAAGA GCGAGCGAGA 
GGGGTCATTA CGTCCAGTGC GGGGAACCAC GCGCAGGGGG TGGCGCTTTC AGGGCAAAAG 
CTGAACTGTA AGGCGATCAT CGCCATGCCG GTGACGACGC CCGCCATCAA AGTGGAGGCG 
GTTCGTCGAC TCGGTGGGAC GGTGGAATTG GTCGGGGAAA ACTACGACGC CACCCAGGCG 
TACGCGAAAG AGCGCGCCGC GGCGGAAGGC CTGACATATA TTCCCCCGTT TGATGATCCT 
TACGTCATAG CGGGTCAGGG CACCGTGGGC GTAGAGGTTA TGCGTCAGTT GCCCTCGGCG 
GAAATCATCT TTGTGCCCAT CGGCGGCGGC GGGCTCGCGG CGGGCATGGT GGCGTACATC 
AAGGCTATTC GACCCGAAAT TCGCGTGATT GGTGTTGAAC CAGCGGGCGC AAACGCGATG 
ACTTTATCTT TGGCTCGCGG TGAGATTGTG AAGTTGTCGA AAGTGGACGG CTTTGCCGAC 
GGCGTCGCAG TTCGTGAGCC AGGGCGCGAT TGCTTTGAGA TTATTCAAAC CATGATTGAC 
GGTATCATCA CCGTGAAAAC GGATCAAATC GCTTCCGCGA TCAAAGACGT ATTCGGTGAC 
ACTCGTTCGA TCCTCGAACC AGCGGGTGCA GTCGCAGTGG CTGGCGCCAA GGCGTATTGC 
CAAGCGCACG GCGTCACCGG TAAAGTCATC GCCGTGACAT CGGGGGCGAA CATGAACTTT 
GATCGTCTTC GCGTGATTTC TGAGATCGCA GATCAAGGGG GTAAGGAAGA AGCCACACTT 
TTGAGTATCA TTCCCGAGAA GAATGGCGAA TTCAAGCGAT TTGTGGAGAC CGTCGGGGAT 
ATCAATATTT CAGAATTTAA ATATCGCGTG CAAGGGGCGG ACGCGCGCGT GCTGTACTCG 
ATCGAGGTTT CCGATTTAAA GGACGTTCAG AACACGATGC AGCGGATGGA AGCGTTAGGT 
TTCAAGACGG TCGACTTGTC TAACGATGCG ACGACGCAAT TTCACCTTCG CCACATGACT 
GGTGGGCAAG GCAGAGTTGA AAACGAAAGG TTGTACAAGG TTGAAATTCC CGAACGCGCG 
GGCGCGCTCG GAAACTTCCT CGAGTTCATC AGTCCTAAGT GGTCGATCTC AATGACGCAT 
TACCGCAACG ACGGTGGTCG CGTCGGTCAG GTTCTTTTCG GCGTGCAAGT CGCTGAAGAA 
GAACGCGAGG TGTTTGAGGA GTGCTTAGAC GGCTGCGGGT ACAAGTACGA CGACATGAGT 
TCGAACATCG CCTTCAAAAC TCTCTTCGGG TGA

Protein sequence

MRPEAKDSDV AREAWYVRAI LTADVYDVAI ESPLELAPRL SDRVGAQIYL KREDLQPVFS 
FKIRGAYNKM KQLTEEERAR GVITSSAGNH AQGVALSGQK LNCKAIIAMP VTTPAIKVEA 
VRRLGGTVEL VGENYDATQA YAKERAAAEG LTYIPPFDDP YVIAGQGTVG VEVMRQLPSA 
EIIFVPIGGG GLAAGMVAYI KAIRPEIRVI GVEPAGANAM TLSLARGEIV KLSKVDGFAD 
GVAVREPGRD CFEIIQTMID GIITVKTDQI ASAIKDVFGD TRSILEPAGA VAVAGAKAYC 
QAHGVTGKVI AVTSGANMNF DRLRVISEIA DQGGKEEATL LSIIPEKNGE FKRFVETVGD 
INISEFKYRV QGADARVLYS IEVSDLKDVQ NTMQRMEALG FKTVDLSNDA TTQFHLRHMT 
GGQGRVENER LYKVEIPERA GALGNFLEFI SPKWSISMTH YRNDGGRVGQ VLFGVQVAEE 
EREVFEECLD GCGYKYDDMS SNIAFKTLFG