Gene OSTLU_18031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_18031
Symbol
ID	5005345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	179720
End bp	180730
Gene Length	1011 bp
Protein Length	336 aa
Translation table
GC content	74%
IMG OID	640420766
Product	ZIP family transporter: zinc ion
Protein accession	XP_001421227
Protein GI	145353880
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0428] Predicted divalent heavy-metal cations transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.265806
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0301114
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGGC GCGCGGCGAC GGCGGTGACT CTCGCGGTGA CGCTCGCGTC GCTGGTCCGC 
GCGCGCGCGC CGCGCACGGC GCGCCGCGGC GGCGACGAGG GCGACGCGCG GGCGGCGGGG 
GCGTGGACGG TCGGGGACGC CGCGCGCGCG ACGCTGGCGT CCGCGTGCGT GTCGCTCGCG 
TCCCTGGTCG GGTGCGCGCT GATGGCGATC GGCGCGCGCG CGGACGCGCT CGCGTGGCTG 
AGCGACGCGG CGATCGGGGC GATGCTCGGG GACGCGCTCG GGTGTCAACT GCCGTCGGCG 
CTCGAGGCGG CGACGCGAGC GCGAGGACGC GACGGCGCGG GCGTCGCGGC GTGCGCGACG 
ACGTGCGGCG TGCTGGCGTT TCATCAGTTG GAGGTGATCG TGCGCGCGGT GAAGGCGCGA 
AACGATGGGA AAGTGGGGAC GACGCGGCGG CGTCGAACGC CGAGCGAAAG CCGAAGCCGA 
AGCCGAAGCC GAGGCGCGAG TGGTCGAGCG CGCGAGCGAC GCGCGGCGGC GCGAGAGATC 
GCGGCGAGCG GATGGCTCAA TCTGTTCGCC GATGCCGCGC ACAACTTCAC CGACGGCGTC 
GTGATCGCGA TCGCGTTCGC CCGGCGCGGC GCGACGCGCG GCTACGCCGC GGCGTGGACG 
ACGCTCGCGC ACGAGCTTCC GCAAGAGCTC GGCGACTACG GCATCTTACG ACGCTCGGGA 
TTCACCGACG TCGAGGCGTT ATGGTTCAAC TTTCTCTCCG CCCTCGTCGC CGTCGGCGCG 
ACCGCGCTCA CGTTCCTCGT CCTGGCCGCG CTCGACGCCG CGAGCGCCTC CGCGTCGTCC 
TTCGCCCGAC GTCTCGCCCT CGACGTTCCC TACCTCGTCG AGGCCTTCTG CGCCGGCGGG 
TTTCTCACCG TCGCCTTCAC CGCCCTTCGC GAGGACGATT CGGGATCCGC GTTCGCGCGC 
GTTCGCGTGT TCGTCGCCGC CGTCCTCGTC GCGCGTCGCG GCGCCCACTG A

Protein sequence

MSRRAATAVT LAVTLASLVR ARAPRTARRG GDEGDARAAG AWTVGDAARA TLASACVSLA 
SLVGCALMAI GARADALAWL SDAAIGAMLG DALGCQLPSA LEAATRARGR DGAGVAACAT 
TCGVLAFHQL EVIVRAVKAR NDGKVGTTRR RRTPSESRSR SRSRGASGRA RERRAAAREI 
AASGWLNLFA DAAHNFTDGV VIAIAFARRG ATRGYAAAWT TLAHELPQEL GDYGILRRSG 
FTDVEALWFN FLSALVAVGA TALTFLVLAA LDAASASASS FARRLALDVP YLVEAFCAGG 
FLTVAFTALR EDDSGSAFAR VRVFVAAVLV ARRGAH