Gene Sare_0997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0997
Symbol
ID	5704679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1120627
End bp	1121805
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	74%
IMG OID	641270512
Product	imidazolonepropionase
Protein accession	YP_001535899
Protein GI	159036646
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.153198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCC TGCTGGTGGA CAACATCGGG GAACTGGTCA CCAACGCCGG GGCGGGTGAC 
GGGCCGCTGG GTATCCGCCG AAACGCCGCC GTGCTCGTCG AGGACGGGCT GGTGGCCTGG 
GTCGGGCCGA ACCGGTACCC GCCGCCCGCC GATCGACGCA TCGACGCCGA GGGCGCGGCC 
GTACTGCCCG GTTTCGTGGA CAGTCACGCC CACCTCGTGT TCGCCGGGGA CCGGGCCGCC 
GAGTTCGCCG CCCGGATGGC CGGCGAACCG TACACCGGCG GTGGTATCCG CACCACCGTC 
GGCGCGACCC GCGCCGCCAC CGACGACGAG CTGCGGGCCA CCGTACGCCG GCTACGCGGG 
GAGGCGCTTC GGCAGGGCAC CACCACCGTC GAGATCAAGA GCGGGTACGG CCTCACCGTC 
CCCGACGAGA CCCGCTCACT GCGGCTCGCC GCCGAGGTGA GCGAGGAGAC CACCTTCCTC 
GGGGCGCACC TCGTCCCCGC CGAGTACGCC GACCGGCCGG ACGACTACGT CGGCCTGGTG 
TGCGGACCGA TGCTCGCCGC CGCCGCGCCG CACGCCCGCT GGATCGACGT GTTCTGTGAG 
CGCGGCGCCT TCGACGCCGA CCACACCCGC GCGATCCTGA CCTGCGGGCA GGCCGCCGGG 
CTGGGGGCAC GGCTGCACGC CAACCAGCTC GGGCCGGGCC CGGGGGTCCA ACTCGGGGTG 
GAGCTGGGGG CGGCCAGCGT CGACCACTGC ACCCACCTCA CCGACGCCGA CGTCGACGCG 
CTGGCCGGGG CCGGCGGGGC AACCGTCGCC ACCCTGCTGC CGGGAGCGGA GTTCTCCACC 
CGCTCGCCCT ACCCGGACGC CCGCCGGCTT CTCGACGCGG GCGTGACCGT GGCACTGGCC 
ACGGACTGCA ACCCCGGGTC GTCGTACACG TCGTCAATGC CGTTCTGCAT CGCGTTGGCC 
GTACGGGAGA TGCGGATGAG CCCGACCGAG GCGGTCTGGG CGGCTACCGC CGGCGGTGCG 
GCGGCGCTGC GCCGCACCGA CGTGGGCCAG CTGACACCCG GCGCGCGGGC TGATCTGATG 
ATCCTCGACG CCCCGTCCCA CCTGCACCTG GCCTACCGGC CGGGGGTTCC ACTGATCCGC 
CAGGTCCTGC ACAACGGAGT ACCTCAATGT CGACCGTAG

Protein sequence

MSSLLVDNIG ELVTNAGAGD GPLGIRRNAA VLVEDGLVAW VGPNRYPPPA DRRIDAEGAA 
VLPGFVDSHA HLVFAGDRAA EFAARMAGEP YTGGGIRTTV GATRAATDDE LRATVRRLRG 
EALRQGTTTV EIKSGYGLTV PDETRSLRLA AEVSEETTFL GAHLVPAEYA DRPDDYVGLV 
CGPMLAAAAP HARWIDVFCE RGAFDADHTR AILTCGQAAG LGARLHANQL GPGPGVQLGV 
ELGAASVDHC THLTDADVDA LAGAGGATVA TLLPGAEFST RSPYPDARRL LDAGVTVALA 
TDCNPGSSYT SSMPFCIALA VREMRMSPTE AVWAATAGGA AALRRTDVGQ LTPGARADLM 
ILDAPSHLHL AYRPGVPLIR QVLHNGVPQC RP