Gene Bcav_0304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcav_0304
Symbol
ID	7858996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beutenbergia cavernae DSM 12333
Kingdom	Bacteria
Replicon accession	NC_012669
Strand	+
Start bp	326697
End bp	328190
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	74%
IMG OID	643864380
Product	sulfatase
Protein accession	YP_002880330
Protein GI	229818804
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.567268
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACC GCCCGAACGT CCTGCTCGTC ATGACGGACC AGCAGCGCTG GGACACGCTC 
GGGTCCGCCG GGGGTCCCGT CGAGACGGCG AACCTCGACC ACCTGGCGGC GCAGGGCACC 
ACGTTCACGC ACGCGTACTC GGCGACGCCG TCGTGCACCC CGGCGCGGGC GTCCCTGCTC 
ACCGGGCAGG ACCCGTGGCA CACCGGCATC CTCGGCATGG GCGCCGGCCA GCCTCCGATG 
GCGGGCCTGG AGAACACGCT CCCGGAGGCG CTCGCGGACG CGGGCTACCA CACGCAGGGC 
GTCGGCAAGA TGCACTTCTC GCCGCAGCGG GCGCTGCACG GGTTCCACGC GACGACGATC 
GACGAGTCGC TCCGCGTCGA GGAGCCGGGC TTCACCTCCG ACTACACGCA GTGGTTCGAG 
CGCCACGCGC CGGCGGACGT GCGGCAGGCC GACCACGGGC TGGACTTCAA CTCGTGGCTG 
GCGCGACCGT TCCACACCGG CGAGCACCTG CACCCGTCGA CCTGGACGGT GACGGAGTCG 
ATCCGCTTCC TGGAGCGCCG CGACCCCACC CGGCCCTTCT TCCTCATGAC GTCGTTCGCG 
CGGCCGCACT CGCCGTACGA CCCGCCCGCG TTCTACTACG AGCACTACCT GCGCCGGCAC 
CACACCGGCG ACCTGCCGCC CGCCGTCGTC GGCGACTGGG CGTCCGTGCA CGATGTGGGC 
GGCGCGGAGG GCATGGACCC CAACGCCTGG CGCGGCCGGC GGACCGCCGA CGAGATCGGG 
CGCGCCCGCG CCGGCTACTA CGGGTCGATC CACCACATCG ACCACCAGAT CGGCCGGCTG 
ATGCGGTACC TGCGCGACCG GCGTCTCGAC GCCGAGACGC TCGTCGTCTT CACCGCCGAC 
CACGGCGACA TGCTCGGCGA CCACCACCTG TGGCGGAAGA CGTACGCGTA CGAGGGGTCG 
GCGCACGTGC CGCTCGTCGT GCGGCTGCCC GCCGGCATGC GCTCCGCCGG CGACGCCGAG 
GTGGTGGACG ATCCCGTGTG CCTGCAGGAC GTCATGCCGA CGATCCTCGA CGCGTGCGGC 
GTCGACGTCC CGGCCAGCGT CGACGGCGCC AGCACGCTGC CGCTCGTCAC CGGCGAGCGC 
GTGCCGTGGC GGGAGTTCGT GCACGGCGAG CACTCCACGT GCTACCACCC GAGCCAGGAG 
ATGCAGTACC TCACCGACGG CGCCTGGAAG TACGTGTGGT TCCCGCGCGG GGACGGCCCC 
GGCTCACCGC GCGAGCAGCT GTTCGACCTG CGCTCCGACC CGTACGAGGA GCGCGACCTC 
GCGCCGCGGT CCGACCACGC CGCCGTCCTG CGGCGGTGGC GAGCACGCCT GGTCGACGTC 
CTCGCCCCTC GGGACGCCGG CCTGACCGAC GGCGGGGCGC TCGTCCCGCA GGACGGGCGG 
CCACCGCTCG TCTCGCCTCA CGCCGCGTCG CGCGTCGCGG AGCGGCTCGC GTGA

Protein sequence

MSDRPNVLLV MTDQQRWDTL GSAGGPVETA NLDHLAAQGT TFTHAYSATP SCTPARASLL 
TGQDPWHTGI LGMGAGQPPM AGLENTLPEA LADAGYHTQG VGKMHFSPQR ALHGFHATTI 
DESLRVEEPG FTSDYTQWFE RHAPADVRQA DHGLDFNSWL ARPFHTGEHL HPSTWTVTES 
IRFLERRDPT RPFFLMTSFA RPHSPYDPPA FYYEHYLRRH HTGDLPPAVV GDWASVHDVG 
GAEGMDPNAW RGRRTADEIG RARAGYYGSI HHIDHQIGRL MRYLRDRRLD AETLVVFTAD 
HGDMLGDHHL WRKTYAYEGS AHVPLVVRLP AGMRSAGDAE VVDDPVCLQD VMPTILDACG 
VDVPASVDGA STLPLVTGER VPWREFVHGE HSTCYHPSQE MQYLTDGAWK YVWFPRGDGP 
GSPREQLFDL RSDPYEERDL APRSDHAAVL RRWRARLVDV LAPRDAGLTD GGALVPQDGR 
PPLVSPHAAS RVAERLA