Gene OSTLU_12872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_12872
Symbol
ID	5003740
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	200065
End bp	201198
Gene Length	1134 bp
Protein Length	330 aa
Translation table
GC content	61%
IMG OID	640419161
Product	ArsAB family transporter: arsenite (ArsA)
Protein accession	XP_001419523
Protein GI	145350244
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.302636
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGACG GACGCGAGCG GAAGTATTAC ATGGTCGGAG GCAAGGGCGG GGTCGGGAAG 
ACGTCGCTGT CGAGCTCGCT CGCGGTGAAG TTCGCGAGCG CCGGGCACGA GACGCTGGTG 
GTGAGCACGG ACCCGGCGCA CTCGCTGAGC GATTCGTTGG CGCAGAACGT CAGGGGAGGG 
CAGCCGGTGG AGGTGAACGA TACGGATGGG ATGCTGTACG CGCTGGAGAT CGATCCGGAG 
AGCGCGAAGG CGGAGTTTAC GCAATTCGCG CGGGCGACGG ACATGAGCGG GGGGGCGAGA 
GATTTTATGA GCTCGGTCGG TTTGGGCGGG TTCGCGGACT CGATCGCGGA TTTGAAGCTC 
GGGGAGCTCT TAGACACGCC GCCGCCGGGG TTGGACGAGG CGATCGCGAT CGCCAAGGTG 
TTGCAGTTTA CGAAGGATGA GAAATTTAGC AAGTTTACGC GCATCGTCTT CGACACGGCG 
CCGACGGGGC ACACGCTGCG GTTGCTGTCG CTTCCGGATT TCCTCGACGC GTCGATCGGG 
AAGATCGTGC GATTACGTCA AAAGCTCACG AGCGCGACGG ATGCGGTGAA GGGGATCTTC 
GGCGTGGGTG AGGACAAGCA GGACGACGCG GTGGAGAAGC TCGAAAAGCT CAAGGCGCAA 
GTCAAGGAAG TGCGCACGCT GTTTCGAAAC AAAGACACCA CCGAATTCAT CATCGTCACC 
ATCCCCACGG TGCTAGGCGT GAGCGAATCG GGCCGCTTGT TACAAAGCCT TCGCGACGAG 
GACGTGCCGT GCAAGCGGTT AATCGTCAAC CAAGTGCTCA AGGTGAACGT CGACGACTTT 
AAAGCCACCG CCGCCGAGGC GCGAGACGCC CAAGACGCCC TCGTCGCGCG ATTATCCGGC 
GACGACGCGG AGGCGTTACA AAAGTACGTC GATTTGAACG CCAAAGCCTT GAAAGCGGCG 
CAGGCCGCGG TGACGTTTTG CAGCGTCAAG GAAAAAGACC AGACGCGCGC GTTGCAAATG 
TGCGAAGAAG ACGCGGGATT AAACTCTCTC AATCGCACCG ACGCGCCGCT GTTTGACATG 
GAAATTCGCG GCGTTCCGGC GTTGAAATTC TTCGGCGACC AAGTGTGGCG ATAG

Protein sequence

MLDGRERKYY MVGGKGGVGK TSLSSSLAVK FASAGHETLV VSTDPAHSLS DSLAQNVRGG 
QPVEVNDTDG MLYALEIDPE SAKAEFTQFA RATDMSGGAR DFMSSVGLGG FADSIADLKL 
GELLDTPPPG LDEAIAIAKV LQFTKDEKFS KFTRIVFDTA PTGHTLRLLS LPDFLDASIG 
KIVRLRQKLT SATDAVKGIF GVGEDKQDDA VEKLEKLKAQ VKEVRTLFRN KDTTEFIIVT 
IPTVLGVSES GRLLQSLRDE DVPCKRLIVN QVLKAAVTFC SVKEKDQTRA LQMCEEDAGL 
NSLNRTDAPL FDMEIRGVPA LKFFGDQVWR