Gene BCG9842_B3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B3874
Symbol
ID	7184382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	1352824
End bp	1354710
Gene Length	1887 bp
Protein Length	628 aa
Translation table	11
GC content	33%
IMG OID	643549189
Product	sulfatase
Protein accession	YP_002444859
Protein GI	218896448
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.295207
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTACAAC ATCTGTTTCC AAAACTGCGA TTTGCACTCG TTGCAGTCGT TTTACTATGG 
ATTAAAACAT ATATTGTGTA CAAGCTAGCA TTTGATATTA AAATTGATAA TTTCTTTGAA 
GAATTCATGC TTTTTATTAA TCCACTAGCT GCGTTACTTT TATTTTTCGG CTTAGCTTTA 
CTTGCATCTA AGCACCGAAA CCGAATTATA ATTGGAATCA GTTTTATACT GTCATTTATT 
TTATTTGGAA ACGCAATGTT TTATGGGTTC TATAACGATT TCGTTACTTT CCCGGTTTTA 
TTCCAAACAA ACAATATGGC TGATTTAGGG ACAAGTATAA AAGAACTCTT TACGTACAAA 
ACATTACTTT TATTTGCAGA TGCAATTATT TTAATGTTTA TTTCGCGTAA ATTCCCATCA 
TTTGGCGACA AAACACCACT TTCCCGCTCA GAGAAGCGAA CTTTCTTTAG CGGTGTAACA 
GCTTTATTAG CACTACAAAT TGTTGTATCA GTTATTTATA AACCACAAAT GTTCTCACGC 
TCATTTGACC GTCAAACTGT TGTGAAAAAT TTAGGTTTAT ACACATATCA TCTATTTGAT 
ATTACACTTC AATCCAAGTC TTCAGCTGAG CGTGTATTTG CAAGTGGCGA TGGATTTTCT 
GAAATTAAGA ACTATACAGA CTCAAAAGAC AAGCAAGTTG ATAAAAACTT ATTTGGAGCT 
GCAAAAGGTA AAAATGTAAT TTTAATTTCA ATGGAATCTA CACAAAGCTT TGTTATTAAT 
AAAAAAATAA ATGGAAAAGA AATTACACCA TTTTTAAATG AATTTATTAA GGATAGCTTC 
TATTTCGATA ACTTCTATCA TCAAACTGGA CAAGGTAAAA CTTCTGATGC TGAATTTATC 
GTTGAAAACT CACTTTACCC ACTAGATCGT GGTTCTGTAT TCTTTACTCA TGCAACAAAT 
GAATACACAG CTACACCAGA ACAATTAAAG AAATACGGAT ATTCTTCTGC CGTCTTCCAT 
TCAAACGATA AAACGTTTTG GAATCGGGAT GTAATGTATC CTACACTTGG ATATGATCGT 
TACTTTAATT TAAATGATTA CGTAGGAACG GAACAAATGT CTGTCGGTTG GGGATTAAAA 
GATAAAGAGT TCTTTGAACA ATCTATTCCA AAGTTAAAAT CTTTACCGCA ACCGTTCTAT 
ACAAAATTTA TTACATTAAC AAATCATTTT CCGTTTCTTC TAAATCCGGA AGACCAATAT 
GTTGATGAAT TCAACTCAGA AAGTGGTGTT GTAAACCGCT ACTTCCCAAC TGTTCGTTAC 
ACAGATGAAG CTCTTAAATT ATTTATTAAA CAATTAAAAG AAGAAGGACT GTATGATAAT 
TCCGTTATTG TCATTTATGG TGATCATTAT GGTATTTCCG AAAACCATAA CGCAGCTATG 
GCACAGTTCC TAGGAAAAGA TACTATTACA CCATTCGATT CTATGCAATT ACAACGCGTT 
CCTCTTATTA TTCATGTGCC TGGTCAAGAA GGAAAAGTTG TTTCTAAAGT ATCTGGTCAA 
ATTGATATTA AACCAACGCT CCTTCATTTA CTTGGTATTA AAACAAATAA ATCCGTTGAA 
TTTGGAACTG ACTTATTTAT TAAAGAAAAA GACCCGCTTA TGGTAATGCG TGATGGTAGC 
TTTGTTTCTG AAGAGTATGT TTATACAAAA AATATGTGCT ACAAAAGAAG TACGGGTGAA 
GAAGCTGACA TGACGCTATG TCAGCCGTAT GTTGAAAAAG CAAAAACAGA ATTAAAACTC 
TCCGATAAAT TAATTTATGG AGATTTATTA CGTTTCGATC CTAATAATCG ATATAAAACC 
GGAACGATGA CAACGAAATT TGAATAG

Protein sequence

MLQHLFPKLR FALVAVVLLW IKTYIVYKLA FDIKIDNFFE EFMLFINPLA ALLLFFGLAL 
LASKHRNRII IGISFILSFI LFGNAMFYGF YNDFVTFPVL FQTNNMADLG TSIKELFTYK 
TLLLFADAII LMFISRKFPS FGDKTPLSRS EKRTFFSGVT ALLALQIVVS VIYKPQMFSR 
SFDRQTVVKN LGLYTYHLFD ITLQSKSSAE RVFASGDGFS EIKNYTDSKD KQVDKNLFGA 
AKGKNVILIS MESTQSFVIN KKINGKEITP FLNEFIKDSF YFDNFYHQTG QGKTSDAEFI 
VENSLYPLDR GSVFFTHATN EYTATPEQLK KYGYSSAVFH SNDKTFWNRD VMYPTLGYDR 
YFNLNDYVGT EQMSVGWGLK DKEFFEQSIP KLKSLPQPFY TKFITLTNHF PFLLNPEDQY 
VDEFNSESGV VNRYFPTVRY TDEALKLFIK QLKEEGLYDN SVIVIYGDHY GISENHNAAM 
AQFLGKDTIT PFDSMQLQRV PLIIHVPGQE GKVVSKVSGQ IDIKPTLLHL LGIKTNKSVE 
FGTDLFIKEK DPLMVMRDGS FVSEEYVYTK NMCYKRSTGE EADMTLCQPY VEKAKTELKL 
SDKLIYGDLL RFDPNNRYKT GTMTTKFE