Gene A9601_02481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02481
Symbol	met3
ID	4716932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	231696
End bp	232871
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	34%
IMG OID	640077947
Product	ATP-sulfurylase
Protein accession	YP_001008643
Protein GI	123967785
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.256568
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAC AACAAAAAAC TAAAACAGAT AATAATGGAC TAATACCGCC TTATGGAGGG 
GAACTAAAAA ATTTAATTAT CAAAGATAAA AGCCTTAAAA ATGAACTTAT TTCTAAAGCT 
ACTTATGAGT TTGAATGTAG CGAGAGAAAT GCATGCGATG TAGAACTTTT AATGGTTGGA 
GCTTTTTCTC CATTGGAAGG TTTTATGGAT GCAAATAACT ACAATTCGGT GATTAAGAAT 
AATAGAAATA CAAGCGGGTT GCTTTTTGGC TTGCCTATTG TATTTGATTC CAATAATGAA 
AAAGTAAAAA CTGGAGAGAC AATATTACTT ACCTATAAAA AACAAAAAAT AGCAGTTTTA 
GAAGTTAGCT CTAAATGGGA GCCTGACAAA TCCTTAGAAG CTGAACTTTG TTATGGTACT 
AATTCTTTAG ATCATCCTGC TGTTAAGATG ATTTTTAACG AGAGAGGTAG ATTTTATATA 
GGAGGAAGAG TTTATGGTTT CGAACTGCCA ACTAGAGAAT TCCCCTGCAA AACTCCAGAA 
GAAGTTAGAT CTACACTGCC ACCAAATCAT GATGTAGTTG CATTTCAATG CAGAAATCCA 
ATTCATAGAG CACATTATGA ATTATTTACT AATGCCTTAC TTTCAGAAAA TGTCTCCTCT 
AAATCAGTTG TTTTAGTTCA TCCAACTTGT GGACCAACTC AACAAGATGA TATCCCGGGG 
AAAGTTAGAT ATTTGACATA TAAAGAATTA GAAGAGGAAA TATCTGATGA AAGAATAAAA 
TGGGCTTTTT TACCTTATTC AATGCATATG GCGGGGCCAA GAGAAGCTTT GCAACATATG 
ATAATCAGAA GAAATTATGG CTGCACCCAC TTTATTATTG GTAGAGATAT GGCTGGTTGT 
AAGTCTTCAT CAACTGGTGA GGATTTTTAT GGTCCATATG ACGCCCAGAA TTTTGCAAAT 
AAGTGCGCAG ATGAATTGAT GATGCAAACT GTTCCTTCAA AAAATTTAGT TTATACGAAG 
GAAAAAGGAT ATATAACAGC TGAAGAAGCC AAAGAATTAA ATTATGAAAT TATGAAACTT 
AGTGGTACTG AATTTAGAAA GAAATTAAGG AATGGCGAAC CAATTCCTGA ATGGTTTGCA 
TTCAAAAGTG TAGTAGATGT TCTAAGACGC TCTTAA

Protein sequence

MELQQKTKTD NNGLIPPYGG ELKNLIIKDK SLKNELISKA TYEFECSERN ACDVELLMVG 
AFSPLEGFMD ANNYNSVIKN NRNTSGLLFG LPIVFDSNNE KVKTGETILL TYKKQKIAVL 
EVSSKWEPDK SLEAELCYGT NSLDHPAVKM IFNERGRFYI GGRVYGFELP TREFPCKTPE 
EVRSTLPPNH DVVAFQCRNP IHRAHYELFT NALLSENVSS KSVVLVHPTC GPTQQDDIPG 
KVRYLTYKEL EEEISDERIK WAFLPYSMHM AGPREALQHM IIRRNYGCTH FIIGRDMAGC 
KSSSTGEDFY GPYDAQNFAN KCADELMMQT VPSKNLVYTK EKGYITAEEA KELNYEIMKL 
SGTEFRKKLR NGEPIPEWFA FKSVVDVLRR S