Gene Daci_5404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_5404
Symbol
ID	5751019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	+
Start bp	5997613
End bp	5998986
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	69%
IMG OID	641300532
Product	sulfatase
Protein accession	YP_001566418
Protein GI	160900836
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.268396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.742595
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG CCGCTTCCCG CCCACAACCC TGCACAGAGC GCATTTGCAT GTCCCGTCCC 
AATATCCTCT TCATCGTGGC CGACGACCTC GGCTATGCCG ACCTCGGCTG CTACGGCGGC 
CGCGCGGCCG ACTTCGGAGC GGTGTCCCCG GTGCTTGACC GCCTGGCCGC CGGCGGCCTC 
AGGCTCACCC AGGGCTATGC CAACTCGCCC GTGTGCTCTC CCACGCGCTT TGCCCTGGCC 
ACGGCGCGCT ACCAGTACCG CCTGCGCGGT GCGGCCGAGG AGCCCATCAA CAGCAAGACA 
CGCGGCACGC CACTGGGCGA AAAGCTGGGC CTGCCGCCGG ACATGCCCAC CGTGGCCTCC 
ATGCTCAGGG ATGCGGGCTA CCGCACGGCG CTGATCGGCA AATGGCACCT GGGCTACCCG 
CCGCACTTCG GCCCGCTGCG CTCGGGCTAC GAGGAATACT TCGGCCCCAT GTCGGGCGGC 
GTGGACTACT TCACCCACCT GAGCAGCTCG GGCCAGCACG ACCTGTGGGT GGGCGAGGAG 
GAACACCATG ACGAGGGCTA CCTGACCGAC CTGCTGTCGC AGCGCAGCGT GGACTTCGTC 
CACCGCATGG CCCAAGGCGA TGCGCCCTTC TTCCTGAGCC TGCACTACAC GGCGCCGCAC 
TGGCCCTGGG AAACGCGCGA TGACCGCAGC ACGGCCGAGG CGCTGGGCGC AGGCATTGCC 
CACCTGGACG GCGGCAACAT CCACCAGTAC CGCCGCATGA TCCACCACAT GGACGAAGGC 
ATAGGCTGGA TCGTCGAGGC GTTGCGCGCC AACGGGCAGC TGGACAACAC CCTCATCGTC 
TTCACCAGCG ACAACGGCGG CGAACGCTTC TCCGACAACT GGCCCCTGGT CGGCGGCAAG 
ATGGACCTGA CCGAGGGCGG CATACGCGTG CCCTGGATCG CGCACTGGCC GGCCGTGATC 
GCTCCGGGCC GCAGCAGCCC CCAGCACTGC ATGAGCATGG ACTGGTCGGC CACGGTGCTG 
GATGCCGCCG GCGTGCAGGC GCCAGAGGGC CATGCGCTGG ACGGCATCTC GCTGCTGCCC 
GTGCTGCGCG CCGAAGATGC CGAATTCCCG CGCACCCTGC ACTGGCGCAT GAAGCACCGC 
GGCCAACGTG CCCTGCGCGA TGGCGACTGG AAGTACCTGC GCGTGGACGG CATCGACTAC 
CTGTTCGACC TTGCCGCCGA CGAGCGCGAG CGCGCCAACC AGGCAGCGCG CGCGCCCGAG 
CGTCTGGCCG CCATGCGCAG CGCCTGGGAA GACTGGAACC AGGGCATGCC GCCCATCCCC 
GAGGACGCCA CGGTCAGCCT GGTCTCTTCG GCCCGGGACA TGCCCCAGCG CTGA

Protein sequence

MSAAASRPQP CTERICMSRP NILFIVADDL GYADLGCYGG RAADFGAVSP VLDRLAAGGL 
RLTQGYANSP VCSPTRFALA TARYQYRLRG AAEEPINSKT RGTPLGEKLG LPPDMPTVAS 
MLRDAGYRTA LIGKWHLGYP PHFGPLRSGY EEYFGPMSGG VDYFTHLSSS GQHDLWVGEE 
EHHDEGYLTD LLSQRSVDFV HRMAQGDAPF FLSLHYTAPH WPWETRDDRS TAEALGAGIA 
HLDGGNIHQY RRMIHHMDEG IGWIVEALRA NGQLDNTLIV FTSDNGGERF SDNWPLVGGK 
MDLTEGGIRV PWIAHWPAVI APGRSSPQHC MSMDWSATVL DAAGVQAPEG HALDGISLLP 
VLRAEDAEFP RTLHWRMKHR GQRALRDGDW KYLRVDGIDY LFDLAADERE RANQAARAPE 
RLAAMRSAWE DWNQGMPPIP EDATVSLVSS ARDMPQR