Gene OSTLU_30712 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30712
Symbol
ID	5000974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	632283
End bp	633323
Gene Length	1041 bp
Protein Length	346 aa
Translation table
GC content	65%
IMG OID	640416395
Product	predicted protein
Protein accession	XP_001416716
Protein GI	145344390
COG category	[F] Nucleotide transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0590] Cytosine/adenosine deaminases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.516627
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGCGC GAACGTCGCT GGACGCGCGC GCGCCGCGCG GGATCCCGGC GAAGGCGCCG 
CGGGACGCGG ACGCGGCGTT GCCGACGCGA AGATGCGTCG TGGCGACGGG AATTCCCGCG 
CGCGCGACGT CGGCGGTGCT CGCGAGCGCG CGGGCGGCGG CGCCGCTTCC GGCGTCGTTG 
GCGCACGTGA AGCGCGCGCG GGCGAGCGCG CGGACGAAGG GGACGACGGA GGTGGTGGTG 
AAGTTGGCGA GCGAGGGCGC GAGCGCGAGC GCGCGGGGAG ACGCGGAAAG CGACGCCGCG 
GTGCGCGCGG ACGTGCTGGA ACGTCACGCG GATGTGATCG CGAGCGTCGT GTACGCAGAC 
GTGCCCGCGG AAGGGCCGGA GGATAGGGAG ACGTGGGAGA AGGCGTGCGC GATTTGGCCG 
GTGAGTTTGA CGGCGCCGGC GGAACGCGAG ACGGAGACGC CGAGCGACGA GGAGGCGGCG 
TATTTTAGAA AGTGGACGAA GCAGGCGTGC GAGGGGGCGA AAATGAGTGG AAATTGTGCG 
ATTATAGTTG ATCCAGCGCG TGATGTTGAG ATCGCCCGGG GCGTGGATGA GTCGGCGACG 
CATCCGTTGC GACACGCCGT CATCGCCGCG GTCGATCTCG CGGCGAAGCG GGACGTCGCG 
ATGTATCCGG AAAAGGAGCA CGTAGAGGCT TTGATCGAGG CGAGACGGAT GGAAAAGCTC 
GAACGCGACG CGCTCGAGAT CGCGGGGGTT GGAGACGACG CAAAAAAACG GAAGCGCGAA 
GTACAAACGA AGGGCTCGGC GATGACAGAA ATCATGGGTC GCCCGTACCT GTGCACGGGA 
TACGACGTGT TTTTAGCGCG AGAGCCGTGC ATCATGTGCG CGATGGGGCT CGTGCATTCG 
AGACTGAAAC GCGTGGTATT TGCCGTGTGC GATAATATCA ATGGCGCGCT CAGCGGACCG 
AGTGGCATTC GCCGTCTACA CGGCGTACGG AGCTTGAATC ATCATTATAG CGTGTTTTCG 
TTCGATGCGG AAGAGATTTA G

Protein sequence

MPARTSLDAR APRGIPAKAP RDADAALPTR RCVVATGIPA RATSAVLASA RAAAPLPASL 
AHVKRARASA RTKGTTEVVV KLASEGASAS ARGDAESDAA VRADVLERHA DVIASVVYAD 
VPAEGPEDRE TWEKACAIWP VSLTAPAERE TETPSDEEAA YFRKWTKQAC EGAKMSGNCA 
IIVDPARDVE IARGVDESAT HPLRHAVIAA VDLAAKRDVA MYPEKEHVEA LIEARRMEKL 
ERDALEIAGV GDDAKKRKRE VQTKGSAMTE IMGRPYLCTG YDVFLAREPC IMCAMGLVHS 
RLKRVVFAVC DNINGALSGP SGIRRLHGVR SLNHHYSVFS FDAEEI