Gene Daci_4639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_4639
Symbol
ID	5750229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	-
Start bp	5095156
End bp	5096211
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	72%
IMG OID	641299742
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001565653
Protein GI	160900071
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.00000215932
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATGCCA ATTCCAAGAA GCCCCGCCTG GACCGCGTGC GCCGCCAGGC CCTGCAACTG 
CTGGGCACCA CCGCCTTCAG CTGGAGCCTG GCCGGCCAGT ACGCACGCGC CGAGACGCCG 
GCCGCCGTGG CCGGGCCCGA GCAGTTGCGC ATCGGCTATC AGAAGTCGGC CGTCAACCTG 
GTCATCCTCA AGCAGCAGGG CGTGCTGGAA AAGCGCTTTG CGGGCACCAA GGTCAGCTGG 
CTGGAGTTCC CGGCCGGCCC CCAGCTGCTG GAGGCCCTGG CCGCAGGCAG CCTGGATTTC 
GGCCTGACCG GCGATTCGCC CCCGGTCTTT GCCCAGGCCG CGGGCCGCGA CCTGCTGTAC 
GTGGGCGCCG AGCCGCCCAA GCCCGAGAGC TCGGCCATCC TCGTGCCATC GGACTCGCCG 
CTGCGCACCC TGGCCGATCT CAAGGGCCGG CGCGTGGCGC TGCAAAAAGG CTCCAGCGCC 
CATTACCTGC TGGTGCGCGC GCTGGACAAG GCGGGCCTGG CCTGGAACGA GATCCAGCCC 
GTGTACCTGG CCCCGGCCGA TGCGCGCGCC GCCTTCGAAC GCAAGAGCGT GGACGCCTGG 
GCCATCTGGG ACCCGTTCTA CGCGGCCACC GAGCTGGCGA TTCGCCCGCG CGTGCTGGCC 
AATGGCGAAG GCCTGTCGGG CAACGCCTCG TTCTACCTGG CCGCGCGCGG ACTGGTGGAG 
CGCCATCCGC AGGTGCTGCG CGCGCTGTTC GACGAGCTCA CGCGCGCCGA TCGCCTGGCC 
CAGAGCGCGC GCCAGGAGGC CGTGGCCCTG GTGGCCGGCT TCAGCGGCCT GGATGCGGCG 
GTGGTCAGCC GCTTCATTGC GCGCCGGCCC AGCTCCCCCG TGGGCCTGCT GGCTGCGCAG 
ACCGTGGTGG ACCAGCAGCG CGTGGCCGAT GCATTTTTTC GGCTGGGCCT GATTCCGCGC 
CAGGTGCAGG TGGCCGACAT CGTCTGGCGG CCCTCGGCGG CCGAGTACGC GCGGCTGGCC 
GAGCCTGCGG CGGCACGGCC TTCTTCCGCC CTTTGA

Protein sequence

MNANSKKPRL DRVRRQALQL LGTTAFSWSL AGQYARAETP AAVAGPEQLR IGYQKSAVNL 
VILKQQGVLE KRFAGTKVSW LEFPAGPQLL EALAAGSLDF GLTGDSPPVF AQAAGRDLLY 
VGAEPPKPES SAILVPSDSP LRTLADLKGR RVALQKGSSA HYLLVRALDK AGLAWNEIQP 
VYLAPADARA AFERKSVDAW AIWDPFYAAT ELAIRPRVLA NGEGLSGNAS FYLAARGLVE 
RHPQVLRALF DELTRADRLA QSARQEAVAL VAGFSGLDAA VVSRFIARRP SSPVGLLAAQ 
TVVDQQRVAD AFFRLGLIPR QVQVADIVWR PSAAEYARLA EPAAARPSSA L