Gene OSTLU_46103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_46103
Symbol
ID	5002751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	+
Start bp	46726
End bp	48713
Gene Length	1988 bp
Protein Length	564 aa
Translation table
GC content	55%
IMG OID	640418172
Product	predicted protein
Protein accession	XP_001418593
Protein GI	145348306
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0441] Threonyl-tRNA synthetase
TIGRFAM ID	[TIGR00418] threonyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.036188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ACGGGGGCGG GCGCGAGCGC GGCGGCGAGC GATAAGGCGA ACGCGACGGC GAGCGACGCG 
GAGCCGGTGA AACTGCTGAC GAGCGATGAG AGCGAGAATT TGTTGAAAAT ACGACACACG 
GTGCGTTGGA AATGCGAGGC GTGGGGAGAC TTGCGTCGGT GGTGGATCGG ACGACGACGC 
GCGAGGGGCG AGCGGAGGGG GTTTGTGCGC GACCTGAACC ACGCAGGGAC GAAAGGAGAC 
TGACGATGGG TTCGCTGATT TTACGCTTCG CAGAGCGCGC ACGTGATGGC GATGGCGGTG 
CAAAAGGTGT TTCCGAGCGC GCAGTGCACG ATCGGGCCTT GGATCGACCG GGGATTTTAT 
TACGACTTTT ACTACCCAGA GGGTTTCACC GATCAAGACA TGAAGAAGAT TCAAAAGGAA 
ATGTATAAGA TTATTCGCAA GGATTACCCG CTTCGCAGGG AGGAAGTGTC GCGAGAAGAA 
GCCGAACGCC GAATCCGGGA GATTAACGAG CCGTACAAGC TCGAAATCTT AGAAGCCATC 
AAGACGGAGC CGATTACGAT TTATCACATC GGCGACGAGT GGTGGGATTT GTGCGCGGGA 
CCTCACGTGG AGTCCACGGG CAAGCTTGAT CAGAAAGCGT TCGCGCTCGA AAGTTTGGCT 
GGGGCGTACT GGCGTGGTGA CGAAACGAAG CCGATGTTGC AGCGCATTTA CGGCACGGCG 
TGGGAGAATG AAGCACAGCT TCAGGCGTAC AACGATTTCA AGGCGGAGGC GAAGCGTCGC 
GATCACCGAA CGATCGGTAA GGATTTGGGT TTGTTCTCCC TTCAACAAGA TAACGCTGGC 
GGCGGCTTGG TGTTTTGGCA TCCGAAAGGC GCGCACATGC GACACATGAT CGAGACGTAC 
TGGAAGGATC TCCATCTGGC GCGCGGGTAC GAGCTCTTGT ACTCACCGCA CGTCGCCAGG 
CAAGAGTTGT GGAAAACCTC TGGTCACAGC GATTTTTATT CCGAGAACAT GTACCAGCCC 
ATCAAGGTTG AAGATGAAAT GTATCAGCTC AAACCGATGA ACTGCCCGTT CCACATCGTC 
GTTTACCAAG ACGGATACTA CTCGTACAAG GATTTACCCA TTCGTTGGGC TGAGCTTGGC 
ACGGTGTATA GATATGAACG TAGCGGCACC ATGCACGGCT TGTTCCGAGT GAGAGGTTTC 
ACGCAGGATG ACGCGCATAT ATTCTGCCTC CCGGATCAAA TCACAGACGA GATCAAGAGC 
GTTCTCGATT TGACTGAAGA AATTCTGAGC ACGTTTGGTT TTAAGGAGTT TGAAGTCAAC 
CTATCCACCA GGCCGGAAAA GTCTGTCGGC GACGACAAGA TTTGGGACAC CGCGGAAGGT 
GCGCTTAAGG ACGCATTGCA AATGAAGGGA TGGGATTACA TCGTCGACGA CGGCGGTGGA 
GCGTTCTACG GGCCGAAGAT TGACATTAAG ATTTTGGACG CAATCGGGCG TAAGTGGCAA 
TGCTCCACGG TGCAGCTCGA CTTCAACCTG CCGGAGCGAT TCGACCTATC CTACGTCGAT 
CGCGAGAACG CAAAGCAGCG ACCAATCATG ATTCACCGCG CCATTTTCGG TTCCCTTGAG 
AGATTCTTCG GTATTCTCAC CGAGAACTAC GCCGGGGAGT TCCCGTTGTG GCTCGCCCCG 
ATTCAAGTGC GCTTGCTTCC TGTGACGGAC GAAGTCAGCG ATTATACCGA AGGCGTCGCG 
AAAAAGCTCC GCGATGCGGG CGTGCGCGTT GAAATTTGCA CCGGACAACG TCTCGCTAAG 
CTCGTGCGCA CGGCTGAGAA GGCAAAGATC CCGGTCATGG CGGTCGTCGG TAGAGAAGAA 
GCGGAGAACA ACACGTTGGC TGTGCGTACG TTCAAGGATG GCGACGTCGG TACATTGTCT 
GTCGACGAAG TGTTGTCACG CGTCACCACC GCGAACGCGA CAAAGGGTCA AAGCTTCTAG 
GAAGAGTC

Protein sequence

MAMAVQKVFP SAQCTIGPWI DRGFYYDFYY PEGFTDQDMK KIQKEMYKII RKDYPLRREE 
VSREEAERRI REINEPYKLE ILEAIKTEPI TIYHIGDEWW DLCAGPHVES TGKLDQKAFA 
LESLAGAYWR GDETKPMLQR IYGTAWENEA QLQAYNDFKA EAKRRDHRTI GKDLGLFSLQ 
QDNAGGGLVF WHPKGAHMRH MIETYWKDLH LARGYELLYS PHVARQELWK TSGHSDFYSE 
NMYQPIKVED EMYQLKPMNC PFHIVVYQDG YYSYKDLPIR WAELGTVYRY ERSGTMHGLF 
RVRGFTQDDA HIFCLPDQIT DEIKSVLDLT EEILSTFGFK EFEVNLSTRP EKSVGDDKIW 
DTAEGALKDA LQMKGWDYIV DDGGGAFYGP KIDIKILDAI GRKWQCSTVQ LDFNLPERFD 
LSYVDRENAK QRPIMIHRAI FGSLERFFGI LTENYAGEFP LWLAPIQVRL LPVTDEVSDY 
TEGVAKKLRD AGVRVEICTG QRLAKLVRTA EKAKIPVMAV VGREEAENNT LAVRTFKDGD 
VGTLSVDEVL SRVTTANATK GQSF