Gene Bphyt_5097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphyt_5097
Symbol
ID	6278286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phytofirmans PsJN
Kingdom	Bacteria
Replicon accession	NC_010676
Strand	-
Start bp	1260505
End bp	1262157
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	62%
IMG OID	642616187
Product	sulfatase
Protein accession	YP_001888830
Protein GI	187919799
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.551425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTA TCATCCCAGC CTTGCTTCTG GCGGCAGGAG CGGCGCTGGC CATCTCGCAC 
CTGGCCGGCG CGCAGACGAT CACCGAACCC ACGAAGCAGC CGGGGCTGGC GGGTTATGAC 
CAGCCCAATC AGTATCTGGC GGCCCGCACG GTCAAGCTCG CGGACAACAT GGAACCGGCC 
ATCGCGCACG GCGACCAGCA GCAGGAGGCC GTTCGCAAGC TGGAAGCCCT GCAGAAAAAA 
ACCGGCAAAC GCCCCAACGT CGTGATCTTC CTGCTCGACG ACGTCGGCTA TAGTGATTTC 
GGCTTCAACG GCGGCGGCGA GGCGGTGGGC AACGCCACGC CCGACATCGA CCGCATCGCG 
AATCAAAGCC TTATCCTGAG TTCGGCGTAT TCGCAGCCGA GCTGTTCGCC GACCCGCGCC 
ACCATCATGA CCGGCCAGAA CATGGCCCAC CATGGCATCC AGATCCCACC CATGTACGGC 
CAGCCGGGTG GTCTCGAAGG ATTGACGACG TTGCCGCAGT TGCTCTCGCG CGCCGGCTAC 
ACGACGCAGG CCGTCGGCAA GTGGCACATG GGCGAAAACG CCGGCTCGCA GCCGCAGAAC 
GTCGGCTTTG ACGACTTCCG CGGCTTCCTC TCGGTGTCGG ACATGTACAC CGAGTGGCGC 
GACCCGCAAT ACAACCCGGA GATCGCGCTG AGCCCGCAGC GTTATCGCTA CATCCTCAAT 
CTGCCGTTCA ACAAGAGCGA CGTACACGCC GTCAAGGGCG GCCAGATCGA AAGCCTGTAT 
GAGATCAACA CCGACACCAT CAAGGATCTC GATACCAAGT GGCTCGACTA CACGGTCGGC 
TTCCTCGACC GGCAGAAGAA CGCCACCAAG CCGTTCTTCC TGTACTACGC TCCGCGTGCC 
TGCCACTTCG ACAACTATCC GAACGAGTAC TACAGCGGGC GTTCGGCGGC GCGCACGAAT 
TATGGCGACT GCATCGTGCA GGTCAACGAC ATGTTCAAAA AGCTGATCGA CACGCTGCAG 
GCGAACGGCG AACTGGATAA CACGATCGTC TTTTTCGCAT CGGATAACGG CCCGGAACAG 
GAGGTGCAGC CGGCCGCCCG CTCGATGTTC CGCGGCGGCA AGGGCTCGAC CTGGGAAGGC 
GCGGTGCGCT CGCCTTTCTT CGTCTACTGG AAGGGGATGA TCGAACCGGG CCGCTCGGAC 
GGCCTGTTCG ACTTCGCCGA CATGTTCAAC ACGTCGGTGG CGCTGTCCGG TACGCCGGGT 
GCGGGCGTCT CAAAGCTGGT CCCGGCAACG ACCTATCTCG ACGGCATCGA CCAGACCTCG 
TTCCTGCTCG CCGACAAAGG CGTCTCAAAC CGGCGCAGCG TTTTTTACTT CTGGAACGAT 
GAGCTTTCGG CTGTGCGCGT CGACGAGTTC AAGCTGATGA AGAAATTCCA GCTTCCCGAC 
GCCGTCACGC AGAAAGGCTA CAACGGCGGT TTCTCGGGAA TGCTCGGCAA TGCATGGACC 
GCGCTGGTCT TCAACCTCTA CACGGATCCC AAGGAAGAGG AGTCGATCGC GATCCGCCAT 
ATCCCGGTCA GCGTGCCGCT CGTGATGGAG TTCGCCCGCT ATCAGCAGGT GCTCAAGAAA 
TATCCCCCGA AAACCCAGGC CTCGCTGAAG TAG

Protein sequence

MKRIIPALLL AAGAALAISH LAGAQTITEP TKQPGLAGYD QPNQYLAART VKLADNMEPA 
IAHGDQQQEA VRKLEALQKK TGKRPNVVIF LLDDVGYSDF GFNGGGEAVG NATPDIDRIA 
NQSLILSSAY SQPSCSPTRA TIMTGQNMAH HGIQIPPMYG QPGGLEGLTT LPQLLSRAGY 
TTQAVGKWHM GENAGSQPQN VGFDDFRGFL SVSDMYTEWR DPQYNPEIAL SPQRYRYILN 
LPFNKSDVHA VKGGQIESLY EINTDTIKDL DTKWLDYTVG FLDRQKNATK PFFLYYAPRA 
CHFDNYPNEY YSGRSAARTN YGDCIVQVND MFKKLIDTLQ ANGELDNTIV FFASDNGPEQ 
EVQPAARSMF RGGKGSTWEG AVRSPFFVYW KGMIEPGRSD GLFDFADMFN TSVALSGTPG 
AGVSKLVPAT TYLDGIDQTS FLLADKGVSN RRSVFYFWND ELSAVRVDEF KLMKKFQLPD 
AVTQKGYNGG FSGMLGNAWT ALVFNLYTDP KEEESIAIRH IPVSVPLVME FARYQQVLKK 
YPPKTQASLK