Gene NATL1_02531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_02531
Symbol	gshB
ID	4779433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	234221
End bp	235150
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	39%
IMG OID	640083518
Product	glutathione synthetase
Protein accession	YP_001014082
Protein GI	124024966
COG category	[H] Coenzyme transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0189] Glutathione synthase/Ribosomal protein S6 modification enzyme (glutaminyl transferase)
TIGRFAM ID	[TIGR01380] glutathione synthetase, prokaryotic

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAC TATTTGTTTT AGATCCAATT GAAAATATCA ATCCTAAGAA GGATTCATCA 
GCAGCACTTA TGCAAGCCGC ATCAAGAGCC AACATAGATG TTTGGATCTG TACTCCCTCG 
GACCTGCAAG CCCGAGGAGA CGATGCATGG GTCGTTTCTA ACAAGGTCAA TTGTGAACCA 
TGGATCAATG TCCAGTCACC TCGAAGCCTT CCTTTAAGAG ATTTCTCATG CATTTGGATG 
CGCAAAGATC CACCTGTTGA CGAGGCTTTT TTATACGCCA CTCATTTATT AGAAGTTGCA 
GAAAGAGATG GTGTCAATGT AATTAACAAG CCTGCATCAC TTAGAGCTTG GAATGAAAAG 
TTAGGAGCTT TAAGATTTAG CGATTTAATG GCTCCCACTC TTGTCGCAAG TAGGGTGGAA 
CAATTAATTA CATTTGCAAA AGAGTATGGA GAAGTTGTAT TAAAACCACT TGGAGGGAAA 
GGTGGGCAAG GAGTCATACG AATTGCAAAG GATGCTCCAG GCTTAGAAGC ATTACTCGAA 
CTGGTTACTT CACAAGAACA TTTGCCAGTG ATGATGCAAC AATTCCTACC AGAAGTAATC 
AATGGTGATA AAAGAATCCT TTTAGTTAAT GGAGAGCCAT TAGGTGCAAT TAATAGACGT 
CCAAAGGAAG GAGACTTCAG AAGCAACTTG GCTTTAGGTG GAAAAGCAGA GACAACTAAA 
TTAACTCCTA AAGAAATAGA GATATGTAAT CAAATAAAGC CCGCTTTACA AGAGGAAGGT 
CTCTTTTTTG TTGGAATAGA TGTGATCGGA GGAATGCTAA GTGAAATTAA TGTGACGAGT 
CCAACTGGTA TTAGAGAAGT AGAGAACCTA ATGAATGTGC CATTAGCAGA TCAAGTAATT 
GATTACCTTA TAGATCATTT GAACAATTAA

Protein sequence

MKQLFVLDPI ENINPKKDSS AALMQAASRA NIDVWICTPS DLQARGDDAW VVSNKVNCEP 
WINVQSPRSL PLRDFSCIWM RKDPPVDEAF LYATHLLEVA ERDGVNVINK PASLRAWNEK 
LGALRFSDLM APTLVASRVE QLITFAKEYG EVVLKPLGGK GGQGVIRIAK DAPGLEALLE 
LVTSQEHLPV MMQQFLPEVI NGDKRILLVN GEPLGAINRR PKEGDFRSNL ALGGKAETTK 
LTPKEIEICN QIKPALQEEG LFFVGIDVIG GMLSEINVTS PTGIREVENL MNVPLADQVI 
DYLIDHLNN