Gene P9301_02491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_02491
Symbol	met3
ID	4911533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	232658
End bp	233833
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	34%
IMG OID	640159815
Product	ATP-sulfurylase
Protein accession	YP_001090473
Protein GI	126695587
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.23115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAC AACAAAAAAC AAAAACTGAC CCTAATGGAC TAATACCGCC TTATGGAGGG 
GAACTAAAAA ATTTAATAAT TAAAGATAAT AGCTTTAAAA ATGACCTTAT CTCCAAAGCT 
ACTTATGAAT TTGAATGTAG CGAGAGAAAT GCATGTGATG TAGAACTTTT GATGGTTGGT 
GCTTTTTCTC CTTTGGAAGG TTTTATGGAT GAAAATAACT ACAAATCGGT TATCGAAAAT 
AACAGAGATA CAAGCGGTTT GCTTTTTGGC TTACCTATTG TCTTTGATTC AAATAATGAT 
GAAGTAAAAG CTGGAGAAAC AATCTTGCTT ACCTACAAAA ACCAAAAAAT TGCAATTTTA 
GAAGTAAGTT CTATTTGGGA GCCTGATAAA TCTTTAGAAG CCGAATTTTG TTATGGTACT 
AATTCTTTAG ATCATCCTGC TGTTAAGATG ATTTTTAATG AAAGGGGAAG ATTCTATATA 
GGAGGGAAAG TTTATGGTTT CGAACTACCA GTTAGAGAAT TTCCCTGCAA AACCCCTGAA 
GAAGTTAGAT CTTCACTGCC ATCAAATTAT GATGTAGTTG CATTTCAATG CAGAAATCCA 
ATTCATAGAG CACATTATGA GTTATTTACT AATGCCCTAC TCTCAGATAA TGTCTCTTCT 
AACTCAGTGG TTTTGGTACA TCCAACTTGT GGGCCAACTC AACAAGACGA TATACCTGGA 
AAAGTTAGAT ATTTGACCTA TAAAGAATTA GAAGAGGAAA TATCTGATGA AAGAATAAAA 
TGGGCTTTTT TACCTTATTC AATGCATATG GCAGGGCCAA GGGAAGCTCT TCAACACATG 
ATAATCAGAA GAAATTATGG CTGCACCCAC TTTATTATTG GTAGAGATAT GGCTGGTTGT 
AAGTCATCAT CAACTGGTGA AGATTTTTAT GGCCCATATG ACGCCCAGAA TTTTGCTAAT 
AAGTGTGCAG ATGAATTAAT GATGCAGACT GTTCCTTCAA AAAATTTAGT TTATACGAAG 
GAAAAAGGAT ATATAACAGC TGAAGAAGCT AAAGAATTTA ATTATGAAAT TATGAAACTT 
AGTGGTACTG AATTTAGAAA GAAATTGAGG AATGGCGAAC CAATTCCTGA ATGGTTTGCA 
TTCAAAAGTG TAGTAGATGT TCTAAGACGC TCTTAA

Protein sequence

MELQQKTKTD PNGLIPPYGG ELKNLIIKDN SFKNDLISKA TYEFECSERN ACDVELLMVG 
AFSPLEGFMD ENNYKSVIEN NRDTSGLLFG LPIVFDSNND EVKAGETILL TYKNQKIAIL 
EVSSIWEPDK SLEAEFCYGT NSLDHPAVKM IFNERGRFYI GGKVYGFELP VREFPCKTPE 
EVRSSLPSNY DVVAFQCRNP IHRAHYELFT NALLSDNVSS NSVVLVHPTC GPTQQDDIPG 
KVRYLTYKEL EEEISDERIK WAFLPYSMHM AGPREALQHM IIRRNYGCTH FIIGRDMAGC 
KSSSTGEDFY GPYDAQNFAN KCADELMMQT VPSKNLVYTK EKGYITAEEA KEFNYEIMKL 
SGTEFRKKLR NGEPIPEWFA FKSVVDVLRR S