Gene Sare_2649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2649
Symbol
ID	5703594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3018412
End bp	3019362
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	71%
IMG OID	641272107
Product	alpha/beta hydrolase fold
Protein accession	YP_001537477
Protein GI	159038224
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0585324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00353536
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGATCCGAG AAGGGGAGCC GGGGACCGAA TTCGCCTATC GAGCGGACAC TAAACGGTTA 
GCGTACGAGG TCTCGGGTGC ACCCGACGGG CACCCGGTCT TCCTCATGCA CGGCACCCCG 
GGGAGCCGCA AGGGGCCAAA GCCGCGAGGA ATCGTCCTCT ATCGATTAGG CGTAAAACTG 
ATCACCTACG ACCGGCCTGG CTACGGCGAC TCGGACCGGT TCGAAGGGCG CGACGTGGCC 
GACGCGGCAC GCGACGTGGA GGCCATCGCG GAGCACCTGG GGCTGGCCCG CTTCGCCGTC 
GTCGGCAGAT CCGGCGGCGG ACCGCACGCC CTCGCCTGCG CCGCCGACCC CACGCTGCGC 
CACCGGGTGA CCCGGGTGGC GGTGCTGGTC GGCTTCGCGC CCGCCAACGC GCCGGAGCTG 
GACTGGTTCG CCGGGATGAA CACCGACAAC GTCCAGGGCT TCGGCGCCGG CCGGTCCGAC 
ACCCCCGCCA TAGTGGAGGA GATCCGCCGC CGGGCGCAGC GGGCCAGCGA AGATCCACGG 
CTGCTGCTGG ACGAACTGAC AACACAGATG ACCGCGGCGG ACCGACGGGT CATCCGCGAT 
CCAGCACTGC GGCGGATGCT CACCGACACG TTCGCCGACG CGCTGCGCGC CGGCCCGTAC 
GGGTGGATCG ACGACGTCCT CGCGCTGCGC CGGGACTGGA AGTTCGACCT CGGCCTGATC 
GACTCCTCGG CGACGAAGGT GCGGCTCTGG CACGGCGCCG AGGACACCTT CGCCCCGGTC 
GGCCACACCC GGTGGCTCGC CTCCCGCATT CCCGGCGCGG AGCTCGAGGT GCAGGCCGGC 
GCGGCGCACT TCGACGCGGT GGAGGAACTG CCACGCATCC TGAGCTGGCT CACCACCGAC 
GACGCGGCGG TGCCCCAGGA CCTCCTGATC GGCGCCCGGT TCGGTCAGTA G

Protein sequence

MIREGEPGTE FAYRADTKRL AYEVSGAPDG HPVFLMHGTP GSRKGPKPRG IVLYRLGVKL 
ITYDRPGYGD SDRFEGRDVA DAARDVEAIA EHLGLARFAV VGRSGGGPHA LACAADPTLR 
HRVTRVAVLV GFAPANAPEL DWFAGMNTDN VQGFGAGRSD TPAIVEEIRR RAQRASEDPR 
LLLDELTTQM TAADRRVIRD PALRRMLTDT FADALRAGPY GWIDDVLALR RDWKFDLGLI 
DSSATKVRLW HGAEDTFAPV GHTRWLASRI PGAELEVQAG AAHFDAVEEL PRILSWLTTD 
DAAVPQDLLI GARFGQ