Gene Sare_4585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4585
Symbol
ID	5705174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5204787
End bp	5205794
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	66%
IMG OID	641273994
Product	pyridoxal-5'-phosphate-dependent protein beta subunit
Protein accession	YP_001539341
Protein GI	159040088
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.7558
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00026814
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGTGGGTCG GCCGACCACT CACCTCTGCT GCCCGCGGTT TCTGGGCGAA GCTCGAGGCG 
TTCAGTCCCG GAGGTATCAA GGATCGCAGC GCACTGCACC TTGTGGCACA GGCGCGCAAG 
CGAGGTGATC TCAGCCCGGG AGCCATGATT GTCGAATCGA CCAGTGGAAC CTTCGGGTTG 
GGACTCGCGC TGGCAGCCAA CGCGTACCAA CATTCACTTA CGCTGGTGAC CGATCCCGGC 
CTTGAGCCGA TTATGCAACG GTTACTGACC GCCTCGGGAG CTGCGATCAG CGTCGTCGAC 
CGCCCACATC TACAGGGCGG GTGGCAGCAG GCCCGGCGGG AGCGCGTGGG CGAGATTCTG 
TCCGCTACCC CTGGTTCATG GTGCCCGGAC CAGTACAACA ACCCGGACAC GTTGCCCGCT 
TACGAGGGTC TCGGCCTGGA GCTCGTCGCA CAGCTGGGAC GCATCGATGT CCTGGTGTGC 
AGCGTCGGTA CGGGTGGTCA CTCCGCCGGC ACGTTCGCGC CTATACGCAG GTACTTTCCA 
CACGCACGGC TTGTCGGGGT CGACACCATC GGCTCAACGA TCTTCGGTCA GCCCGCGCGT 
CACCGGCTGA TGCGGGGGCT GGGCAGCAGC ATCTATCCCC GCAATGTCCA GTACGGCTGG 
TTCAGCGAGG TCCACTGGGT GGCACCTGCC GAGGCCGTGT GGGCGTGCCG GCAGCTCGCC 
GCACACGGCT ATGTCAGCGG CGGGTGGAGC GTTGGCGCCG TCGCCCTCGT CGCCGCCTGG 
CTGGCGCGGA CGTTGCCATT CGACACCCGT ATCGTGGCCG TCTTCCCAGA CGGACCACAG 
CGCTACTGGG ACACCGTTTT CAACGACGAC TACTGCCGAC GGCACGACCT GCTTGGCATC 
GAACCGGCCG CTGACCCCGA CAGCATCTGC GCCCCGACCA GCCACGAGGT CCACCGGTGG 
ACCCGCTGCA CCCAGATCGT TGACCTCGGG CAGAGTGATC GGCGATGA

Protein sequence

MWVGRPLTSA ARGFWAKLEA FSPGGIKDRS ALHLVAQARK RGDLSPGAMI VESTSGTFGL 
GLALAANAYQ HSLTLVTDPG LEPIMQRLLT ASGAAISVVD RPHLQGGWQQ ARRERVGEIL 
SATPGSWCPD QYNNPDTLPA YEGLGLELVA QLGRIDVLVC SVGTGGHSAG TFAPIRRYFP 
HARLVGVDTI GSTIFGQPAR HRLMRGLGSS IYPRNVQYGW FSEVHWVAPA EAVWACRQLA 
AHGYVSGGWS VGAVALVAAW LARTLPFDTR IVAVFPDGPQ RYWDTVFNDD YCRRHDLLGI 
EPAADPDSIC APTSHEVHRW TRCTQIVDLG QSDRR