Gene Sare_0467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0467
Symbol
ID	5703646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	535479
End bp	536540
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	69%
IMG OID	641269992
Product	glutathione S-transferase-like protein
Protein accession	YP_001535387
Protein GI	159036134
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0671242
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGAGG ACGGAGCGGC GAGCGGCGGC GACGAGTCAC CGGGGCGCAC CGGCGGGAGG 
TATGTCGAGC CGGGCGGCGA GTTCACCCGG GATCAGCGCT ATATCGCCAC CCGGATCACC 
GTTGACGGCG GGGACGGCTG GCCGGTGGAG CCGGGGCGGT ACCGACTGGC GGTGAGTCGC 
GCCTGCCCAT GGGCGAGCCG ACTGGTCATC GTCCGACGGC TACTCGGGCT GGAGGGCGCC 
ATCTCGATGG CGATCGCCGG CCCGACCCAC GACGAACGAA GCTGGACCTT CGACCTCGAC 
CCCGGTGGGC GGGATCCGGT GTTCGGCATC GAACGGCTGG CGGAGGCGTA CTTCGCGCGC 
TTTCCCGGCT ACGACCGCGG CATCACCGTG CCGGCGATCG TCGACGTGCC GACCGGGCAG 
GTGGTGACCA ACGACTACGC GCAGATGAGC CTCGACCTGT CGACCCAGTG GACCGAGTAC 
CACCGTGACG GGGCGCCGGA CCTCTACCCG CAGCGGCTAC GAGACGAGAT CGACGAGGTC 
AACGAGGTCG TCTTCACCGA TGTCAACAAC GGTGTCTACC GGTGCGGCTT CGCTGGCAGC 
CAGCAAGCGT ACGACCGGGC CTACCGGCGG CTGTTCGACC GACTGGACTG GTTGAGCGAC 
CGACTCGCCG GGCGCCGCTA CCTGGTCGGG GAGACGATCA CCGAGGCGGA TGTGCGGCTG 
TTCACCACGT TGGTCCGCTT CGACCCGGTC TACCACGGCC ATTTCAAGTG CAACCGGAGC 
AGGTTGACCG AGATGCCGGT GCTCTGGGCG TACGCCCGGG ACCTGTTCCA GACTCCCGGA 
TTCGGCGACA CCGTCGACTT CGACCACATC AAGCGCCACT ACTACGAGGT ACAACGGGAC 
ATCAACCCGA CCGGGATCGT CCCCCTCGGC CCTGATCTGT CGGCCTGGCT GACGCCGCAC 
GATCGGGGGG CCCTGGGCGG CCGTCCCTTC GGCGACGGCA CCGCACCGCC TCCGCCCGCA 
CCGGCCGAGC GGGTTGACCC TGCGCACACC CCGTTGCACT GA

Protein sequence

MTEDGAASGG DESPGRTGGR YVEPGGEFTR DQRYIATRIT VDGGDGWPVE PGRYRLAVSR 
ACPWASRLVI VRRLLGLEGA ISMAIAGPTH DERSWTFDLD PGGRDPVFGI ERLAEAYFAR 
FPGYDRGITV PAIVDVPTGQ VVTNDYAQMS LDLSTQWTEY HRDGAPDLYP QRLRDEIDEV 
NEVVFTDVNN GVYRCGFAGS QQAYDRAYRR LFDRLDWLSD RLAGRRYLVG ETITEADVRL 
FTTLVRFDPV YHGHFKCNRS RLTEMPVLWA YARDLFQTPG FGDTVDFDHI KRHYYEVQRD 
INPTGIVPLG PDLSAWLTPH DRGALGGRPF GDGTAPPPPA PAERVDPAHT PLH