Gene Sare_0855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0855
Symbol
ID	5705958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	955614
End bp	956984
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	69%
IMG OID	641270374
Product	cystathionine beta-synthase
Protein accession	YP_001535764
Protein GI	159036511
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0877269
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGTACT ACGACAACGT CGTCGAGTTG ATCGGCAACA CCCCGCTGGT ACGCCTGCGC 
AACGTGACCG AGGGTATCCA GGCCACCGTG CTGGCGAAGG TGGAGTACCT GAATCCAGGT 
GGGTCGGTCA AGGACCGGAT CGCCCTGCGC ATGGTGGAGG ACGCCGAGCA GGCGGGGATC 
CTGCGGCCGG GCGGCACGAT CGTCGAGCCG ACCAGCGGCA ACACCGGCGT GGGGCTGGCT 
CTGGTGGCGC AGCTCAAGGG CTACCGGTGC GTGTTCGTCT GCCCGGACAA GGTCAGTCAG 
GACAAGCAGG ACGTGCTGCG TGCCTACGGT GCCGAGGTGG TGGTCTGCCC GACCGCTGTC 
GCGCCCGCGG ACCCACGGTC CTACTACAAC GTCTCTGACC GCCTTGCCCG GGAGATCCCC 
GGCGCCTGGA AGCCCAACCA GTACGCGCAC CCGGCGAACC CCCGCTCCCA CTACGAGACC 
ACCGGGCCGG AGCTGTGGGC GCAGACCGAG GGCCGGATCA CCCATTTCGT CGCCGGTGTC 
GGCACCGGTG GCACGATCTC CGGCATCGGC CGTTACCTGA AGGAGGTGTC CGGGGGGCAG 
GTCAAGGTGA TCGGCGCTGA CCCGGAGGGG TCGGTCTACT CCGGTGGCAC CGGGCGGCCG 
TACCTGGTCG AGGGCGTCGG CGAGGACTTC TGGCCGGAAA CCTACGACCG GGGGGTCGCC 
GACGGGATCG TCGAGGTCTC CGACAAGGCG TCGTTCGAGA TGACCCGCCG CCTGGCCCGC 
ACCGAGGGCC TGCTGGTCGG TGGCTCCTGC GGGATGGCGG TCGTCGCGGC GTTGGAGGTG 
GCCCGTGCGG CTGACCCGGA CGACGTGGTC GTGGTACTCC TGCCGGACGG TGGTCGCGGA 
TACCTCTCCA AGATCTTCAA CGACTCGTGG ATGGCCCGGT ACGGTTTCGT GGACAACTCT 
GGCAGTGAGC CGACCATCGC CGAGACGCTC GCCGGCAAGC CAGGTGGGCT GCCCGAACTG 
GTGCACGTAC ACCCCACCGA GACGGTCCGT GACGCGATCG ACTACCTGCG CGAGTACGGT 
GTCTCCCAGC TGCCGGTGCT GAAGGCCGAA CCGCCGGTGG TTACCGGCGA GGTGGCCGGA 
TCGGTCGCGG AGCGAGACCT GCTCGACGCG CTCTTCACCG GCCAGGCGCA GCTACACGAC 
ACCATCGAGC GGCACATGGC CGCGCCGCTG CCGATGATCG GCGGTGGGCA GCCGGTCAGC 
GAGGCGGTCG CCCTGCTGGA GAAGTCCGAC GCCGCGCTGG TGCTGATCGA TGGCAAGCCG 
AAGGGCGTGC TCACCCGGCA GGACCTGCTC GCGCACCTCG GTTCCCGCTG A

Protein sequence

MQYYDNVVEL IGNTPLVRLR NVTEGIQATV LAKVEYLNPG GSVKDRIALR MVEDAEQAGI 
LRPGGTIVEP TSGNTGVGLA LVAQLKGYRC VFVCPDKVSQ DKQDVLRAYG AEVVVCPTAV 
APADPRSYYN VSDRLAREIP GAWKPNQYAH PANPRSHYET TGPELWAQTE GRITHFVAGV 
GTGGTISGIG RYLKEVSGGQ VKVIGADPEG SVYSGGTGRP YLVEGVGEDF WPETYDRGVA 
DGIVEVSDKA SFEMTRRLAR TEGLLVGGSC GMAVVAALEV ARAADPDDVV VVLLPDGGRG 
YLSKIFNDSW MARYGFVDNS GSEPTIAETL AGKPGGLPEL VHVHPTETVR DAIDYLREYG 
VSQLPVLKAE PPVVTGEVAG SVAERDLLDA LFTGQAQLHD TIERHMAAPL PMIGGGQPVS 
EAVALLEKSD AALVLIDGKP KGVLTRQDLL AHLGSR