Gene P9303_23841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_23841
Symbol	met3
ID	4776428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2101472
End bp	2102644
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	55%
IMG OID	640087904
Product	ATP-sulfurylase
Protein accession	YP_001018382
Protein GI	124024075
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2046] ATP sulfurylase (sulfate adenylyltransferase)
TIGRFAM ID	[TIGR00339] ATP sulphurylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.114558
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCCA GTCCCTCTGC ATCTGCCCAG TCTCCCGGCG TGATCGCGCC CTATGGAGGG 
ACACTGGTGG ATTTGATGGT GGCTACTGAT CAGCAGGAAG CTGTCAAGGC CAGTGCCAAC 
CATGTGTTGG AGTGCTCAGA TCGCAATGCT TGCGATCTGG AGTTGCTTGT CGGTGGAGGC 
TTTTCGCCTG AGCGGGGCTT TATGCATCAG GGTGATTACG ACGCTGTTGT TGCAGGCCAT 
CGCACTCTTT CCGGCTATCT TTTCGGCCTG CCAATCGTGA TGGATACCGA TCGAGAGGAT 
GTAGCGATCG GTGATCGGGT GTTGCTGAGT TACAAGGGTC AGGATTTGGC AGTTCTTCAA 
GTCGAGGACA AATGGGAGCC CGACAAGGTG GTGGAAGCCA AAGGTTGCTA TGGCACTACC 
TCTCTAGAAC ATCCCGCTGT GCGCATGATT GCCACTGAAC GCAAGCGCTT TTATCTCGGG 
GGCACCTTGC AGGGTTTGGA GTTGCCTAAG CGTATTTTTC CTTGCAAGAG CCCTGCTCAG 
GTTCGGGCGG AACTTCCTGC CGGGGAGGAC GTTGTTGCCT TTCAGTGTCG CAATCCCATT 
CATCGCGCTC ACTACGAGTT GTTTACGCGA GCCTTGCATG CCAGCAATGT GAGCGAGAAC 
GCTGTTGTGT TAGTGCATCC AACCTGTGGA CCAACTCAGC AGGATGATAT CCCTGGTGGC 
GTACGTTTTC AGACCTATGA GCGGTTGGCT GCTGAGGTAG ATAATCCCCG CATTCGCTGG 
GCCTATCTTC CCTATGCCAT GCATATGGCA GGTCCGCGCG AAGCCCTGCA ACACATGATT 
ATTCGCCGCA ATTATGGATG TACCCATTTC ATCATCGGTC GTGACATGGC CGGATGTAAG 
TCCTCCCTTA GCGGCGATGA CTTCTATGGC CCTTACGACG CGCAGAACTT TGCACAGGAA 
TGTGCAGGAG AGCTGGCAAT GGAAACGGTC CCCTCGTTGA ATCTTGTTTT CACTGAAGAG 
GAGGGCTACG TCACTGCCGA GCATGCTGAG GCTCGTGGAT TACATGTCAA GAAGCTCAGC 
GGTACGCAGT TCCGCAAGAT GTTGAGAAGT GGCGAGGAGA TCCCTGAGTG GTTCGCCTTC 
CGTAGCGTGG TTGAGGTGCT GAGAGCCACG TGA

Protein sequence

MIASPSASAQ SPGVIAPYGG TLVDLMVATD QQEAVKASAN HVLECSDRNA CDLELLVGGG 
FSPERGFMHQ GDYDAVVAGH RTLSGYLFGL PIVMDTDRED VAIGDRVLLS YKGQDLAVLQ 
VEDKWEPDKV VEAKGCYGTT SLEHPAVRMI ATERKRFYLG GTLQGLELPK RIFPCKSPAQ 
VRAELPAGED VVAFQCRNPI HRAHYELFTR ALHASNVSEN AVVLVHPTCG PTQQDDIPGG 
VRFQTYERLA AEVDNPRIRW AYLPYAMHMA GPREALQHMI IRRNYGCTHF IIGRDMAGCK 
SSLSGDDFYG PYDAQNFAQE CAGELAMETV PSLNLVFTEE EGYVTAEHAE ARGLHVKKLS 
GTQFRKMLRS GEEIPEWFAF RSVVEVLRAT