Gene BCG9842_B2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B2289
Symbol
ID	7181784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	2857832
End bp	2859805
Gene Length	1974 bp
Protein Length	657 aa
Translation table	11
GC content	35%
IMG OID	643550758
Product	sulfatase
Protein accession	YP_002446428
Protein GI	218898017
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000748062
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	1.58706e-23
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACAGT TCTTATTAAA GAGCAAAAGT GTGTTAAGCA ATCATTTTGG ATTCTTTCTG 
TTTGCCGTTA TTTTATTGTG GCTCAAAACG TATGCAGCCT ATGTAACGGA ATTTAATTTA 
GGAATTTCAA ACACAATCCA AAAATTCTTG CTGTTTTTTA ACCCGCTTAG TTCAGCAGTT 
CTATTTTTAG GACTTGCATT ATTTGCAAAA GGGAAGCGAT CTTATATTTG GTTAATTGTT 
ATCAACTTGT TATTGTCGAT TCTTTTATAT GCAAACGTAG TTTACTATCG CTTTTTCAGT 
GACTTTATTA CGTTCCCAAC ATTAACACAA ACGAATAACT TTGGAGATTT AGGTGGTAGT 
ATTCTTGCGT TGCTACATCT TTATGATCCA CTATACTTCT TAGACACGAT TATATTAATT 
GTGTTAGTTG CAACAAAATT TGCAAATCCA AAACCAATTC GTGTTGCGAA GCATAAAGTA 
TCTCTAGTAT TTGTAGCAGG TATTTTATTA TTCAGTGTTA ATTTAGGTCT TGCAGAGTCT 
GACCGTCCGG AATTATTAAC AAGAACGTTT GACCGTAATT ATATTGTGAA ATATTTAGGG 
GCATACAACT ACACAATTTA TGATGGAATT CAAAGTGCGA AAGCATCGAC AGAACGAGCA 
TTAGCTGATG GCGATAATAT GACAGAAGTA CGAAATTATT TAACATCAAC TTATGCAAGT 
CCAAATCCTG AGTATTTCGG TAAAGGAAAG GGAATGAACG TAATTTATAT TCATTTAGAG 
TCATTCCAAA ACTTCTTAAT TGATTACAAA TTAAATGGTC AAGAAGTTAC ACCGTTCTTA 
AACTCATTTA CAAAAGATGC GAATACGCTA TACTTTGATA ACTTCTTCCA TCAAACAGGA 
CAAGGGAAAA CATCTGATGC GGAGTTTATG TTAGAGAATT CAATGTTTGG TTTACCGCAA 
GGTTCTGTCT TTACAACGAA ATCTCATAAT ACGTATCAAT CAGCACCAGC TATTTTAGGA 
CAACAAGGAT ACACATCAGC AGTATTCCAT GGTAACTACA AAACATTCTG GAACCGTGAC 
GATATTTATA AATCATTTGG TTTTAATAAA TTCTTTGATG CGTCATACTA CGATATGAAT 
GAAAAAGACG TAGTAAACTA CGGATTAAAA GATAAACCGT TCTTTAATGA ATCTATTCCG 
TTATTACAAA CGTTGAAACA ACCGTTCTAT ACGAAGTTTA TTACGTTATC GAACCATTTC 
CCTTATCCAA TTGATAAGGC AGAAGCAACG ATTGAACCAG CAACAACAGG TGATTCATCA 
GTAGATACGT ACTTCCAAAC AGCACGCTAT TTAGATGAAT CTGTAAAAGG CTTCATCGAT 
TACTTGAAAC AATCTGGTTT ATATGATAAC TCAATTATCG TTATGTACGG AGACCATTAC 
GGTATTTCAG ATAATCATAA CGCAGCAATG TCAAAAGTAA TGGGTAAAGA AATGAACTCA 
TTTGAAAATG CACAGTTACA ACGTGTGCCT TTAATCGTTC GTGTACCAGG AGTGAAAGGT 
GGCGTACAAC ATCAATATGG CGGTGAAATT GACGTTCTTC CTACGTTATT ACACTTACTA 
GGTACAGATA CGAAAAACTA TGTTCAATTC GGTTCAGATT TATTATCACC AGAGCATAAA 
CAAGTCGTTG CGTTCCGTAA CGGTAACTAC GTAAGCCCAA CTGTTACTGC ACTAAACGGC 
AAATACTATG ATACAACAAC TGGAAAACCT GTAGAATTTA CAGATGAAAT AAAGAAAAAT 
GAACAAATGG TTCAAAACTC ACTAAAATAC TCTGACCAAG TCGTAAATGG TGACTTATTA 
CGATTCTACA CACCGGAAGG ATTCACTCCA GTAGATCGTT CGAAGTATAA CTATAACAAT 
CGTGATAAAA ACAAAACGAA GGTAAAAACG ACTCCGGAAG GGGAAGCTAA ATAA

Protein sequence

MKQFLLKSKS VLSNHFGFFL FAVILLWLKT YAAYVTEFNL GISNTIQKFL LFFNPLSSAV 
LFLGLALFAK GKRSYIWLIV INLLLSILLY ANVVYYRFFS DFITFPTLTQ TNNFGDLGGS 
ILALLHLYDP LYFLDTIILI VLVATKFANP KPIRVAKHKV SLVFVAGILL FSVNLGLAES 
DRPELLTRTF DRNYIVKYLG AYNYTIYDGI QSAKASTERA LADGDNMTEV RNYLTSTYAS 
PNPEYFGKGK GMNVIYIHLE SFQNFLIDYK LNGQEVTPFL NSFTKDANTL YFDNFFHQTG 
QGKTSDAEFM LENSMFGLPQ GSVFTTKSHN TYQSAPAILG QQGYTSAVFH GNYKTFWNRD 
DIYKSFGFNK FFDASYYDMN EKDVVNYGLK DKPFFNESIP LLQTLKQPFY TKFITLSNHF 
PYPIDKAEAT IEPATTGDSS VDTYFQTARY LDESVKGFID YLKQSGLYDN SIIVMYGDHY 
GISDNHNAAM SKVMGKEMNS FENAQLQRVP LIVRVPGVKG GVQHQYGGEI DVLPTLLHLL 
GTDTKNYVQF GSDLLSPEHK QVVAFRNGNY VSPTVTALNG KYYDTTTGKP VEFTDEIKKN 
EQMVQNSLKY SDQVVNGDLL RFYTPEGFTP VDRSKYNYNN RDKNKTKVKT TPEGEAK