Gene Bcav_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcav_2095
Symbol
ID	7859375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beutenbergia cavernae DSM 12333
Kingdom	Bacteria
Replicon accession	NC_012669
Strand	-
Start bp	2369550
End bp	2371088
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	67%
IMG OID	643866187
Product	sulfatase
Protein accession	YP_002882110
Protein GI	229820584
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0111977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACG GGAAGCCGAA CATCCTGGTG ATCTGGGGCG ACGACATCGG CATCACGAAC 
CTCAGCTGCT ACAGCGACGG CCTCATGGGG TACTGGACCC CGAACATCGA CCGCATCGCC 
GCCGAGGGCA TGCGCTTCAC CGACTCGTAC GGGGAGCAGA GCTGTACCGC GGGCCGGTCG 
TCGTTCATCA CCGGGCAGAG CGTGTTCCGC ACCGGCCTGA GCAAGGTCGG GATCCCGGGC 
TCGCCCATCG GCCTGCAGGC GGAGGACCCC ACCATCGCGG AGCTGCTGAA GCCGCTCGGG 
TACGCGACCG GACAGTTCGG GAAGAACCAC CTCGGCGACA AGAACGAGTT CCTCCCGACG 
GCGCACGGGT TCGACGAGTT CTACGGCAAC CTTTACCACC TCAACGCCGA GGAGGAGCCC 
GAGCTGCCGA ACTGGCCGTC GCCCGAGGAC TTCCCGGGGT TCAACGAGCG TGCACGCCCC 
CGCGGGGTCA TCCACTCCTG GGCGACGGAC GTCGACGACC CGACCGAGGA CGGCCGCTTC 
GGTCCGCGCG GCAAGCAGCG GATCGAGGAC ACCGGGGCGC TCACGAAGAA GCGGATGGAG 
ACGGTCGACG AGGAGTTCGC CGCCGCCGCG CAGGACTTCA TCGCACGCCA GGTGGACGCG 
GACACGCCGT TCTTCGTGTG GATGAACACG ACGCACATGC ACTTCAGGAC GCACCCGAAG 
CCGGAGAGCG TGGGTCAGGC CGGACGGTGG CAGTCGCCGT ACCACGACAC GATGATCGAC 
CACGACCGCG TCGTCGGGGG CCTGCTGGAC CAGCTCGACG AGCTCGGCAT CGCCGAGGAC 
ACGATCGTCA TCTACTCGAC GGACAACGGG CCGCACATGA ACACGTGGCC CGACGGCGGG 
ATGACGCCGT TCCGCAGCGA GAAGAACACG AACTGGGAGG GTGCGTTCCG GGTGCCCGAG 
ATGATCCGGT GGCCCGGGCG GATCGCGGCC GGCGTCGTGT CGAACGAGAT CGTCCAGCAC 
CACGACTGGC TGCCCACCTT GCTCGCGGCG GCCGGCGACA CGGGCGTCGT CGACGACCTC 
AAGCAGGGGA AGACGATCGG CGACGTCACC TACAAGGTGC ACATCGACGG CTACAACCTG 
CTCCCGTACC TGACCGGCGA GGCCGACGAG AGCCCGCGCA AGGGGATGGT CTACTTCTCC 
GACGACGGCG ACGTGCTAGC GCTCCGGTTC GACAACTGGA AGGTCGTGTT CATGGAGCAG 
CGGGTGCCCG GGACGCTCCG CGTGTGGGCC GAGCCGTTCG TACCGTTGCG GGTCCCGCTC 
CTGTACAACT TGCGCACCGA CCCGTTCGAG CGGGCGACGA TCACGTCGAA CACCTACTAC 
GACTGGCTGT TCGACAACGA CTATCTCGTC TTCGCGTCGC AGGTGATCAT GACGCAGTTC 
CTGGCGACAT TCCGTGAGTA CCCGCCGCGC CAGCGCGCCG CGAGCTTCAG CATCGACCAG 
GCGGTCGAGA AGCTCCAGTC GTTCCTCGGC AGCAACTGA

Protein sequence

MPNGKPNILV IWGDDIGITN LSCYSDGLMG YWTPNIDRIA AEGMRFTDSY GEQSCTAGRS 
SFITGQSVFR TGLSKVGIPG SPIGLQAEDP TIAELLKPLG YATGQFGKNH LGDKNEFLPT 
AHGFDEFYGN LYHLNAEEEP ELPNWPSPED FPGFNERARP RGVIHSWATD VDDPTEDGRF 
GPRGKQRIED TGALTKKRME TVDEEFAAAA QDFIARQVDA DTPFFVWMNT THMHFRTHPK 
PESVGQAGRW QSPYHDTMID HDRVVGGLLD QLDELGIAED TIVIYSTDNG PHMNTWPDGG 
MTPFRSEKNT NWEGAFRVPE MIRWPGRIAA GVVSNEIVQH HDWLPTLLAA AGDTGVVDDL 
KQGKTIGDVT YKVHIDGYNL LPYLTGEADE SPRKGMVYFS DDGDVLALRF DNWKVVFMEQ 
RVPGTLRVWA EPFVPLRVPL LYNLRTDPFE RATITSNTYY DWLFDNDYLV FASQVIMTQF 
LATFREYPPR QRAASFSIDQ AVEKLQSFLG SN