Gene Sare_1665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1665
Symbol
ID	5703435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1917041
End bp	1918051
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	74%
IMG OID	641271169
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001536544
Protein GI	159037291
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGG AGAGCGTGGC CGCCGACGTG GTCGCGGAGC TGGCCGACCT GGCGGTGTGG 
TTCCCGACGC CGGCGGGGGT GGTACGGGCC GTGGACGGGG TGTCCCTCCG GGTGCGCCGT 
GGCGAGACGC TGGGCCTGGT CGGCGAGTCC GGCAGCGGCA AGTCGACGAC GGGGCTGGCG 
CTGCTGCGCC TGGTCGAGCC CACCGCCGGC GAGGTCCGGG TGGCGGGGCA GGACGTGACC 
CGCTGGTCAC GGCGGCGGTT GCGGCGGTTG CGCCGTCGCG TCGCCATGGT GTTCCAGGAT 
CCGCAGGCTT CGCTCGATCC GCGGCACACG GTCGGGGCGA GCATCGCCGA GCCGCTGGCC 
GTGCACCGGC TCACCGCCGG TGGCTCGGCC CGCCGCGAGC GGGTGGCCGA GCTGCTCGAC 
CTGGTCGGCC TGCGCCGCGA TCTCGCCGAC CGGCACCCGC ACGAGCTCTC CGGCGGCCAG 
CGGCAGCGGG TGGGTATCGC GCGGGCCCTG GCCGGCGAGC CGGACCTGAT CGTTCTCGAC 
GAACCGATCG CCTCCCTGGA CCTGAGTGTG CAGGCACAGA TCATGAACCT GCTCCGGGGA 
CTCCAGCGGG AGTTGGGGCT GACCTATCTC TTCATCTCCC ACGACCTCGC CGCTGTCGAG 
CACATGAGCG ACCGGGTGGC CGTGATGTAC CTCGGCCGGA TCGTGGAGAG CGGTACGCCG 
GCACAGATCT GGCGAGAGCC CGCCCATCCG TACACCGCCG CGCTCCTGTC GGCCGTGCCG 
GTGGCAGATC CGCCGGTGCA GCGCGGTCGG CAGCGGATCA TCCTCGCCGG TGACGTCCCG 
AGCCCGATCG ACCCGCCCAC CGGCTGCCGC TTCCGGACGC GGTGTCCGCA GGCGCGGCCC 
GACTGCGCCC GGACCGATCC GGTGCTGGTC GAGATCGGCT CGGGACACCA AGCGGCCTGC 
CTGTTCGCGG GCGAGGCGGT GCGGGCGATG CGGGCGGACA CGGCCCGGTA G

Protein sequence

MTGESVAADV VAELADLAVW FPTPAGVVRA VDGVSLRVRR GETLGLVGES GSGKSTTGLA 
LLRLVEPTAG EVRVAGQDVT RWSRRRLRRL RRRVAMVFQD PQASLDPRHT VGASIAEPLA 
VHRLTAGGSA RRERVAELLD LVGLRRDLAD RHPHELSGGQ RQRVGIARAL AGEPDLIVLD 
EPIASLDLSV QAQIMNLLRG LQRELGLTYL FISHDLAAVE HMSDRVAVMY LGRIVESGTP 
AQIWREPAHP YTAALLSAVP VADPPVQRGR QRIILAGDVP SPIDPPTGCR FRTRCPQARP 
DCARTDPVLV EIGSGHQAAC LFAGEAVRAM RADTAR