Gene OSTLU_51201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_51201
Symbol
ID	5005156
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	-
Start bp	258262
End bp	259970
Gene Length	1709 bp
Protein Length	503 aa
Translation table
GC content	59%
IMG OID	640420577
Product	predicted protein
Protein accession	XP_001421099
Protein GI	145353608
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0017] Aspartyl/asparaginyl-tRNA synthetases
TIGRFAM ID	[TIGR00457] asparaginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.037074
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCGA GAGCGACGCC GGGAGCGATC AAACACGCGC GGAGCGCGCG CGCGGTGGCG 
ACGCGGGCGA CGTACGGACG ACCCGAGCGC ATCGCGCGCG TGAAGGGAAA CGACGGGGGG 
GCGTCGCGCG TGGGCGAGGC GTTGGAACTG CGAGGGTGGG CGCGATCGGT GCGGACGCAG 
AAGGGAATGG CGTTCATCGA CCTGAACGAT GGGAGCGCGA TCTCGGGGAT GCAAGCGGTG 
GTGAACGAGG GAAGCGCGGC GTGGGACGCG CTCGACGCGG GCGGCGTCTC CACGGGGGCG 
GCGCTCAGGG TGAAGGGGAA ACTCGTGGCG AGTCCGGGAG GGAAGCAAGC GGCGGAATTG 
GCGGTGGAGG AGATTGATGT CATCGGAACG GCGGATCCGG AGACGTATCC GCTGCAAAAG 
AAGCGACACA CGCTGGAATA TCTTCGAAGC ATCGCGCACT TGCGACCTCG CACAAACACC 
ATCGGCGCCG TGGCTCGCGT GCGCAATCAG TTGGCGTACG CGACGCACAC GTTCTTTCAA 
GAGCATGGGT TTTTATACGC CAACACGCCG ATCATCACCG CGTCGGATTG CGAAGGCGCT 
GGGGAACAGT TTCAAGTGAC GACGCTGTTG AACGGCTTCG GCGCCGGCGA GTGGACGACG 
CCGGCCTCGG TCGTGGACGA GCAAGAAGCC ATGGTGAAGG CACAGGGTGA CGCGGTGAAG 
GCCCTGAAGG AGGCGAAGAA AGCGGGAGAC GCGACGAAAG AGCAAGTTGA TGAGGCCGTG 
GCGAAGCTTT TAGATCTCAA GGCGAGCGTC GAGGCGCTGA AGAACAATCG CCCGTCGTCC 
GACTTGCCGA AGAATAAGGA TGGTTCCATC GACTATTCTC AAGACTTCTT CGGCAAACCG 
TCTTATTTGA CCGTGTCTGG GCAATTGAAC GGTGAAATCA TGGCTTGCGC GGTCAACGAC 
ATCTACACCT TCGGTCCGAC GTTCCGCGCG GAGAATAGCA ACACGTCGCG CCACCTGGCT 
GAGTTTTGGA TGGTAGAGCC CGAACTCGCG TTCGCGGATT TGAACGACGA CATGGATTGC 
GCAGAAGCGT ACTTGAAGTA TTGCCTGAAC CACGTCCTCG AGCACTGCGA CGAAGATCTT 
GAATTCTTCG AGAAGAACAT CTCCAAAGAC AACCTGAGAG AGCGACTTCG AAACGTCGCG 
TCGCAAGAGT TTGCGCGCAT CACGTACACC GAAGCCGTCG AGCACGTGTT GAACGCGAAG 
AAGAAGTTTG AGTTCCCAAT CGAATGGGGA TCGGATCTTC AGAGCGAGCA CGAGCGGTAC 
ATCTCAGAAG AAGTCTTCAA AGATCGCCCC GTGATCGTGC GCGATTATCC GAAAGATATC 
AAGGCGTTCT ACATGCGTCT CAACGACGAC AACAAAACCG TCGCCGCAAT GGACGTCTTG 
GTGCCCCGCG TTGGTGAGTT GATGGGTGGT AGCCAAAGAG AAGAACGCCT TGATGTCTTG 
GAGCGCCGAA TCGAAGAGGT TGGTTTGGAA AAGGAGTCGT ACTGGTGGTA CTTAGATTTG 
AGACGATACG GTTCGCAGCC GCACGCCGGT TTCGGCCTCG GTTTTGAACG CCTCGTTCAG 
TACGTCACAG GTGTGGAGAA CATTCGTGAC GCCATTCCTT TCCCCCGTTA CCCGGGTAGC 
GCTGAGTTCT AGATTTAGTC TAACGCGGC

Protein sequence

MRARATPGAI KHARSARAVA TRATYGRPER IARVKGNDGG ASRVGEALEL RGWARSVRTQ 
KGMAFIDLND GSAISGMQAV VNEGSAAWDA LDAGGVSTGA ALRVKGKLVA SPGGKQAAEL 
AVEEIDVIGT ADPETYPLQK KRHTLEYLRS IAHLRPRTNT IGAVARVRNQ LAYATHTFFQ 
EHGFLYANTP IITASDCEGA GEQFQVTTLV EALKNNRPSS DLPKNKDGSI DYSQDFFGKP 
SYLTVSGQLN GEIMACAVND IYTFGPTFRA ENSNTSRHLA EFWMVEPELA FADLNDDMDC 
AEAYLKYCLN HVLEHCDEDL EFFEKNISKD NLRERLRNVA SQEFARITYT EAVEHVLNAK 
KKFEFPIEWG SDLQSEHERY ISEEVFKDRP VIVRDYPKDI KAFYMRLNDD NKTVAAMDVL 
VPRVGELMGG SQREERLDVL ERRIEEVGLE KESYWWYLDL RRYGSQPHAG FGLGFERLVQ 
YVTGVENIRD AIPFPRYPGS AEF