Gene P9303_27941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_27941
Symbol
ID	4778659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2460403
End bp	2461404
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	46%
IMG OID	640088317
Product	glutathione S-transferase N terminus protein
Protein accession	YP_001018789
Protein GI	124024482
COG category	[O] Posttranslational modification, protein turnover, chaperones [S] Function unknown
COG ID	[COG0625] Glutathione S-transferase [COG3502] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAATC CGTTGTTGTA TAGCTTCCGT CGCTGCCCTT ATGCAATGAG AGCCCGATGG 
GCTCTTTTGG TTTCTGGCCT TTTGGTGAAC TTGCGGGAAG TGGCCCTAAA CAATAAGCCA 
CCAGAGCTGC TGCAGGCTTC TCAAAAAGGA ACGGTGCCAG TGCTGTTGAC TGCAGATGGG 
ACAGTGATTG ATGAAAGCAT GGACATCATG CACTGGGCTC TTCAGCAAGC TGATCCCTTC 
GATGGGCTAC GCAGCGGAAA AGCCGAAGAA CAACAAACAA TTCAGCAGCT TATCGAACAG 
AATGATGGCC CGTTTAAATA TCATTTAGAT CGTTTTAAAT ATGCTTGCAG GTTCAAAGGA 
GAAGATGCCG AAGAACATCG CAACATGGCT AGAGACATTC TTGTGGAATG GAATGCGCGA 
CTAGCACAAC AAGAATCAAG TGATTGCTAT GGTTGCTTGA TTGGAGAATC TCAGAGCTTG 
GCAGACTGGG CTCTATGGCC TTTTGTGCGT CAATATCGTC TCGCTGATCC ATCAAGCTTT 
GATTGCGATC AAGACCTTCA AGCCATTAAA AGATGGTTGA AAGCCTTTCT GCAACATCCA 
CTGTATGCAA GATTGATGAC ACCAGTTAAG CCTTGGTTGC CAGAACATCA ACCGCAGACG 
TTCCCTGCTG ATTCAAGTTT AGTTAAAACA GATCAACCAT TGTTTCATCT GGCTTTGCTT 
GAAGACTGGC AAGACGCATG CAATCAAGGG GTTTATCAAT TCTCTACTCG CGGATTAAAA 
CTCAAAGAGA TAGGATTCAT CCATTTGAGC TATCAGCATC AACTTGAGTC TACTTATCAT 
CAATTTTATC GTGATCGAGG CCAGGTGCTT AGCTTGAAAT TAAACCCAGA GCAACTGACA 
ATGCCGCTTC GAGCCGAACC CTCATCAGCA GGGGAGCTTT TCCCTCATCT TTTTGGAGTC 
CTGCCTTTGA GTGCTGTAGA ACTTGTGGAA ACTTATCCAT GA

Protein sequence

MSNPLLYSFR RCPYAMRARW ALLVSGLLVN LREVALNNKP PELLQASQKG TVPVLLTADG 
TVIDESMDIM HWALQQADPF DGLRSGKAEE QQTIQQLIEQ NDGPFKYHLD RFKYACRFKG 
EDAEEHRNMA RDILVEWNAR LAQQESSDCY GCLIGESQSL ADWALWPFVR QYRLADPSSF 
DCDQDLQAIK RWLKAFLQHP LYARLMTPVK PWLPEHQPQT FPADSSLVKT DQPLFHLALL 
EDWQDACNQG VYQFSTRGLK LKEIGFIHLS YQHQLESTYH QFYRDRGQVL SLKLNPEQLT 
MPLRAEPSSA GELFPHLFGV LPLSAVELVE TYP