Gene Sare_1158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1158
Symbol
ID	5705749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1308406
End bp	1309527
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	73%
IMG OID	641270676
Product	cystathionine gamma-lyase
Protein accession	YP_001536057
Protein GI	159036804
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0760832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000519282
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

GTGAGTGACG TGACCGCTGA CCGCGACGGC ACCCGCTGTG TCCGCGCCGG GCTGCCCGAG 
GCCGTGCCCG GGGAGCCGTT CCTACCCGGC CCGGTCTTCG CCGCGCCTTA CCACCTGGAC 
CCGTGGGCGG GTCCGGCGGG CGCACCGAAT GGCTACGGCC GGTCGGACAA CCCGACCCGC 
CGGTTGCTGG AGGCGGCGAT CGGTGAGCTG GAGGGGGGCG ACTGCCGGGT CCTGTCCAGC 
GGGCAGGCGG CGATCACCGG GCTGCTGATG AGTGTGCTGC GCCCCGGCGA CACGGTGGTG 
CTTCCCGCCG ACGGCTACTT CTCGGTACGG GCGTTCGCCA CCGAGACCCT GGCCGGCATC 
GGGGTACGGG TGCTCTTCGT GCCGACTGTC GGACCGTATC CGGACCTCTC CGGCGTACGC 
CTGGTGTTCG TGGAGACGCC GGCCAACCCG GGCCTGGACG TTGTCGACGT GCGTGCATTG 
GCCGCCCGCG CGCAGGCGGC CGGGGCCCTG TTGGCGGTGG ACAACACGAC CGCGACTCCG 
CTCGGGCAGC GTCCGTTGGA ACTCGGCGCC GACCTGGTGG TGGCCTCCGG TACGAAGGCA 
CTCACCGGCC ACTCGGACCT GCTGCTCGGC TACGTCGCCA GCCGGTCGGT CGAGGTGCTG 
GCGGCGGTGA CGGGGTGGCG GGATCACACG GGGGCGATAC CGGGCGCGTT CGACGCCTGG 
CTGGCACACC GGTCCCTGGC CACGCTCGAC CTGCGGCTTG CCCGACAGAC CGAGAACGCC 
TCGGCGCTCG TTCGGATGCT GGCGGGGCAA CCGCGGGTGA CCGGGCTGCG TTGGCCGGGT 
AGGCCGGAGG ACCCGGCCTA CCCGGTGGCC GTGGCCCAGA TGCGTCGGAT GCCGGGGGTG 
CTCTCGTTCG ATCTCGGCGA CGCCGACCGG GTCGCCCGGT TCGTTGACGC GGCCCGGCTG 
GTGGCGGCGG CTACCTCGTT CGGCGGGCTG CACACCACCG CCGACCGGAG GGCACAGTGG 
GGCGACGACA CCTCGCCCGG TTTCGTCCGG CTCTCGTGCG GGGTCGAGGA CACCACCGAC 
CTGGTCGCCG ACGTGGCGGC CGCGTTGAGG GCCGCTGGTT GA

Protein sequence

MSDVTADRDG TRCVRAGLPE AVPGEPFLPG PVFAAPYHLD PWAGPAGAPN GYGRSDNPTR 
RLLEAAIGEL EGGDCRVLSS GQAAITGLLM SVLRPGDTVV LPADGYFSVR AFATETLAGI 
GVRVLFVPTV GPYPDLSGVR LVFVETPANP GLDVVDVRAL AARAQAAGAL LAVDNTTATP 
LGQRPLELGA DLVVASGTKA LTGHSDLLLG YVASRSVEVL AAVTGWRDHT GAIPGAFDAW 
LAHRSLATLD LRLARQTENA SALVRMLAGQ PRVTGLRWPG RPEDPAYPVA VAQMRRMPGV 
LSFDLGDADR VARFVDAARL VAAATSFGGL HTTADRRAQW GDDTSPGFVR LSCGVEDTTD 
LVADVAAALR AAG