Gene BCG9842_B1434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B1434
Symbol
ID	7182621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	+
Start bp	3698158
End bp	3700077
Gene Length	1920 bp
Protein Length	639 aa
Translation table	11
GC content	33%
IMG OID	643551607
Product	sulfatase
Protein accession	YP_002447277
Protein GI	218898866
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.511966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.0230537
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATA AAATAAATTT ACAAATGCAA AATATAAGTT TTGTTATAAT AATGGCTTTA 
GCAGTATGGT TAAAAACATA TCTTATTACG CGATTCAGTT TTGATTTAAA AATTGAGTCT 
TCAACGCAAG AGCTTATTTT GTTTATTAGC CCTCTAGCCG CATCATTAGC ATTTGTTGGA 
TTAGCATTAT TTGCAACTGG TGAAAAGCGA AATTATATAG CGCTATGTAT TAATTTCTTA 
TTAACGATCG TGCTTGTTGG AAATGTAATG TTCTATGATT TTTATAGTGA TTTCGTTACA 
TTACCAGTAC TTGGACAAAC CTCAAACTTT GGCCAATTAG GCGGCAGTAT TATAGAGATA 
TTAAACTACA AAATTATACT CGCATTCGTA GACATTGTTT TCTTCTTTAT TTTATTAAAA 
AAGAAATCAT TGGTCTTTAA AACAGAACGT GTAACTCATT CTACACGCTT GTTATACTTT 
CTTTTAACGA TTGGTGTATT CTTTGCGAAT CTACAGCTTG CAGAAAAAGA GCGCCCTGAA 
TTATTAACGA GATCATTCGA CCGGGTAATG CTTGTCAAAA ATTTAGGCTT ATATACTCAC 
CAAGTATATG ACTTAACACT GCAAGTAAAA GCTGGGTCAC AAAAAGCACT TGCTGATAGT 
AGTAAATTAC AAGAAACTGA AAACTACGTA AAAGCAAACC AAAGCGAGCC AAACCCTAAT 
ATGTTTGGTG CAGCGAAAGG AAAAAACGTA ATTGTCGTCA CTCTTGAATC CTTGCAGACC 
TTCTTAATAG GCGCATCAGT CAATGGGCAA GAAGTTACAC CATTCCTAAA TGAATTCATA 
AATGAAAGTT ATTACTTTGA TAACTTTTTC CATCAAACTG GTCAAGGGAA AACATCCGAT 
TCTGAATTTC TAATCGATAC GTCGTTGTAT CCATTAAATC GAGGGGCTGT ATTCTTCACA 
CACGGTAACA ATGATTATAC TGCGACTCCA GAAATTTTAC GTCAGCAAGG TTATTTCACT 
TCTGTATTCC ATGCGAATAA CGCAACATTT TGGAATCGTA ATATTATGTA CTCCGCTCTT 
GGTTATGATC GTTACTATAA TGAGCTTGAT TACAAAATTA CGCCAGAAAC AAATTTAAAT 
TGGGGATTAA AAGATATCGA ATACTTTGAT CAATCAGTAG ATATATTAAA AACTGTTGAT 
CAACCATTCT ATGCTCGTTT CCTTACTTTA ACAAACCATT ATCCATTCAC GTATGATGAA 
GATACAAAAT TCATTGAACC ATACAACTCT GGTAATGGCG TATTCGATCG TTACATCGTA 
ACTGCACGTT ACTTAGACGA ATCAATTAAA AAATTTATTG AGCGTTTAAA GGCCGAGGGA 
ATGTATGATG ATTCTATTAT TGTGTTATAC GGTGATCATT ATGGCATTTC CGAAAAACAT 
AATCGTGCAA TGGCACAGTT TTTAGACAAA GATCAAATAA CAGAATTTGA TACTTTAAAT 
TTACAACGTA CACCTTTATA TATTCATATT CCTGGACAAA CAGAAGGTCA AACTATTTCA 
AAGCCTACGG GACAAATCGA TATGAAACCT ACTATTCTAA ATTTATTAGG TGTTGGTTCT 
ACGAATGATA TCCGTTTTGG CCATGATATG TTTTCAGATG AATATACTGG CTTTGTTGTT 
TTACGCGATG GTAGCTTCGT TACAGATAAG TATGCATACA AAAACAACAC TTTCTACGAC 
CGTATAACAG GGGAAATTGT AGATTTACCA AAAAAAGAAG CTCAAGCCCT CATTAAACGT 
GCACAAAATG AATTACGAAT GTCTGACAAA ATTATTGAAG GCGATTTATT ACGCTTCTCA 
GAAAGTAATA AAATTAAAAC TGGCGAAGTA CAAACTAAAA TTAAAGAAAC AGAAAAATAA

Protein sequence

MKNKINLQMQ NISFVIIMAL AVWLKTYLIT RFSFDLKIES STQELILFIS PLAASLAFVG 
LALFATGEKR NYIALCINFL LTIVLVGNVM FYDFYSDFVT LPVLGQTSNF GQLGGSIIEI 
LNYKIILAFV DIVFFFILLK KKSLVFKTER VTHSTRLLYF LLTIGVFFAN LQLAEKERPE 
LLTRSFDRVM LVKNLGLYTH QVYDLTLQVK AGSQKALADS SKLQETENYV KANQSEPNPN 
MFGAAKGKNV IVVTLESLQT FLIGASVNGQ EVTPFLNEFI NESYYFDNFF HQTGQGKTSD 
SEFLIDTSLY PLNRGAVFFT HGNNDYTATP EILRQQGYFT SVFHANNATF WNRNIMYSAL 
GYDRYYNELD YKITPETNLN WGLKDIEYFD QSVDILKTVD QPFYARFLTL TNHYPFTYDE 
DTKFIEPYNS GNGVFDRYIV TARYLDESIK KFIERLKAEG MYDDSIIVLY GDHYGISEKH 
NRAMAQFLDK DQITEFDTLN LQRTPLYIHI PGQTEGQTIS KPTGQIDMKP TILNLLGVGS 
TNDIRFGHDM FSDEYTGFVV LRDGSFVTDK YAYKNNTFYD RITGEIVDLP KKEAQALIKR 
AQNELRMSDK IIEGDLLRFS ESNKIKTGEV QTKIKETEK