Gene OSTLU_37879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_37879
Symbol	ATS1
ID	5004239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	-
Start bp	61496
End bp	62680
Gene Length	1185 bp
Protein Length	394 aa
Translation table
GC content	61%
IMG OID	640419660
Product	ATP sulfurylase (sulfate adenylyltransferase)
Protein accession	XP_001420064
Protein GI	145351391
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.624538
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGC GCGAGCGGAC GTTCGCGTCG CAGAGCGAAG GGTTGATCGC GCCGCACGGC 
GGCGCGCTGG TGAATCTGAT GCTCGAGGAC GACGGGGCGA AGGCGAGGGC GATCGCGTCG 
TGCACGCGGG CGCTCGAGCT GTCGGATCGA AACGCGTGCG ACGTCGAGCT GCTGAGCGCG 
GGGGGGTTCT CGCCGCTGCG AGGGTTCATG AACGAGGACG AGTACGAACA CTGCGTGGAG 
ACGATGCGGT TGAAGGGGAG CGAGCTGTTG TTCGGGCTGC CGATCGTGTT GGACACGAAT 
TGCGAGGACA CCAAGGCGGG CGACAGAGTG TTGCTCAAGT ATCAGGGCAA GGACGTCGGC 
GTGCTGACGG TGGAGTCGAA GTGGAAGCCG AATAAGCCGA AAGAGGCGAA GATGTGCTAC 
GGGACGAGCT CCATCGAGCA TCCCGGCGTG GCGATGATCT CCATGGAGCG TCGCAAGTAT 
TACATCGGTG GTAAGATTGA GGGTTTGAAC ATTCCGCAGC GACCGTTTCC GTGCCCGACG 
CCCGCCGAGG TGCGCGCGGG GTTGCCCGCG GGTAAGGATG TCGTGGCGTT CCAGTGCCGC 
AACCCGGTGC ACCGCGCGCA CTACGAGCTC TTCACTCGCG CTTTGCACGC GGAAAACGTC 
GGTAAGGACG CCGTGTGCCT CGTTCACCCG ACCATGGGTC CGACCCAAGA CGACGACATC 
TCGGGCTTGG TGCGATACAA GACGTACGTC GTCCTCGCGG AAGAGGTGAA GAACCCGCAA 
ATTCGCTGGG CCTACCTCCC GTACTCCATG CACATGGCGG GTCCGCGCGA AGCTATTCAG 
CACATGATCA TTCGTAAGAA CTACGGCTGC ACGCACTTCA TCATCGGTCG CGATATGGCT 
GGTTCCAAGT CTTCCCTCGA CGGAGAAGAC TTTTACGGCG CGTACGACGC CCAAGACTTG 
GCCAAGGCGA ACGCGGCTGA GCTCGGCATG AAAACCGTCC CGAGCTTGAA CGTCGTGTAC 
ACCGAAGAAG AAGGCTACGT CACCGCCGAT GTCGCCAAGG AGAAGGGTCT CAACATCAAG 
AAGCTCAGCG GCACCAAGTT CCGCCAAATG TTGAGAGGCG GCGAGGACAT TCCAGAGTGG 
TTCGCGTTCA AGTCCGTCGT CAAGGTCCTT CGCGAGAACA TTTAG

Protein sequence

MTARERTFAS QSEGLIAPHG GALVNLMLED DGAKARAIAS CTRALELSDR NACDVELLSA 
GGFSPLRGFM NEDEYEHCVE TMRLKGSELL FGLPIVLDTN CEDTKAGDRV LLKYQGKDVG 
VLTVESKWKP NKPKEAKMCY GTSSIEHPGV AMISMERRKY YIGGKIEGLN IPQRPFPCPT 
PAEVRAGLPA GKDVVAFQCR NPVHRAHYEL FTRALHAENV GKDAVCLVHP TMGPTQDDDI 
SGLVRYKTYV VLAEEVKNPQ IRWAYLPYSM HMAGPREAIQ HMIIRKNYGC THFIIGRDMA 
GSKSSLDGED FYGAYDAQDL AKANAAELGM KTVPSLNVVY TEEEGYVTAD VAKEKGLNIK 
KLSGTKFRQM LRGGEDIPEW FAFKSVVKVL RENI