Gene Sare_0095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0095
Symbol
ID	5707065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	106526
End bp	107461
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	75%
IMG OID	641269621
Product	urea amidolyase related protein
Protein accession	YP_001535021
Protein GI	159035768
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000550439
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGGCA TCCCACCGGC CGACCGGGTC GGGGCGGCCG ACACACCCGG CAGAAGTGCG 
GAGCCCGGCA TGGTCGAGGA GCCCGGCATG GTCGAGGTAG TGCGGGCCGG CGCTCTCACC 
ACCGTGCAGG ATCTCGGCCG GCCCGGCTGG GCGCACCTCG GCGTACCGCG CTCCGGTGCC 
CTCGACCCGA GCGCGCTCCG GTTGGCCAAC CGGCTGGTCG GCAACCCGGA GACCGCCGCC 
GGTCTGGAGA TCACCCTCAC CGGCTGTGGG CTGCGGTTTC GCGGTGCCAC CACCGTCGCG 
GTCACCGGGG CGGACGTCCC CGTGCGGGTC AATGATCGGC CCGGCGATGT AGGACGGCCG 
CTCGCCGTGC CGGCGGGCGC GGTGCTGCGG GTCGGCCCAC CCCGCACCGG CCTGCGGTCC 
TGGCTCGCGG TCGCCGGTGG GTTCGCCGTC GAACCGGTGC TCGGCAGCCG CGCCACGGAC 
ACCCTTTCCG GGCTCGGCCC GCCCCTGCTG CGCGACGGCG ACCGGCTTCC CATGGGCGTG 
CCAGCTGGGC CGCCCGCCCC GGTGGACGCC ACCGCGACCG TGCCGACGCC GGCCGAGGTG 
CGGCTGGCAC TGCGCCTTGG CCCGCGGGCC GACTGGTTCA CGCCACTCGC GCTCGAACTG 
CTGCTCGGCA CGGCCTACAC CCTCACTCCG CTCAGTAACC GCATCGGTGC TCGGCTGTCC 
GGGGCGCCGC TGCCCCGCGC GGTGGTGGGG GAACTGCCCA GTGAGGGCCT CGTGCTCGGT 
GCGGTGCAGG TGCCGGCGGA CGGCCAACCC CTGGTCTTCC TCGCCGACCA TCCGACCACC 
GGTGGATACC CGGTCGTCGG GGTGGTGGTC GACGTGACCC CGCTTGCGCA GGCCCGGCCA 
GGCACTACGG TGAGGTTCCA TGGATCTCAA CGCTGA

Protein sequence

MTGIPPADRV GAADTPGRSA EPGMVEEPGM VEVVRAGALT TVQDLGRPGW AHLGVPRSGA 
LDPSALRLAN RLVGNPETAA GLEITLTGCG LRFRGATTVA VTGADVPVRV NDRPGDVGRP 
LAVPAGAVLR VGPPRTGLRS WLAVAGGFAV EPVLGSRATD TLSGLGPPLL RDGDRLPMGV 
PAGPPAPVDA TATVPTPAEV RLALRLGPRA DWFTPLALEL LLGTAYTLTP LSNRIGARLS 
GAPLPRAVVG ELPSEGLVLG AVQVPADGQP LVFLADHPTT GGYPVVGVVV DVTPLAQARP 
GTTVRFHGSQ R