Gene SeD_A3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3994
Symbol	bcsB
ID	6874145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3838306
End bp	3840606
Gene Length	2301 bp
Protein Length	766 aa
Translation table	11
GC content	57%
IMG OID	642786950
Product	cellulose synthase regulator protein
Protein accession	YP_002217578
Protein GI	198244249
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.118962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.69945
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGAA AATTGTCCTG GATGTGTGCG GCGGTAATAG GATTAAGCGC GTTTCCTGCT 
TTCATGACGG CGGCGGCGCC TGCTACGCCG CCATTGATAA ATGCTGAACC CACCGAGCCT 
GCGCCGTCGC CCGCAACTGA GGCGCCCGTC GTGGCACAGA CCGCGCCTTC GCGCGAGGTC 
AAGCTGACCT TTGCGCAAAT CGCGCCGCCG CCGGGTAGTA TGGCGCTGCG TGGCGTTAAC 
CCTAACGGCG GCATTGAATT TGGTATGCGC AGCGATGAAG TGGCGTCGAA AGCGGTGCTG 
AATCTGGAAT ATACGCCCTC GCCGTCGCTC CTGCCGGTTC AGTCGCAGCT CAAGGTTTAT 
CTCAATGATG AACTGATGGG CGTACTGCCG GTGACAAAAG AGCAGTTGGG GAAAAAGACG 
CTGGCGCAGG TACCTATCAA TCCGCTATTT ATCACCGATT TTAACCGGGT GCGGCTGGAG 
TTTGTCGGCC ACTATCGCGA CGTGTGTGAA AATCCGGCCA GCAGTACTCT GTGGTTAGAC 
ATCGGGCGAA ATAGCGCCCT GGATCTGACC TATAACATGC TGGCGGTGAA TAACGATCTG 
TCCCACTTCC CGGTGCCGTT TTTCGAGCCG CGGGATAACC GTCCGGTGAC GTTGCCGATA 
GTGTTTGCTG ACATGCCGGA TCTGGCGCAG CAGCAGGCGG CTTCTATTGT CGCGTCCTGG 
TTTGGCTCGC GGGCGGGCTG GCGCGGTCAG CGCTTCCCGG TGTTGTATAA TCACCTGCCG 
GATCGCAATG CGATCGTGTT CGCCACCAAC GATCGACGCC CCGATTTCCT GCGCGATCAT 
CCTGCGGTTA ACGCGCCGGT TATCGAGATG ATGAGCCATC CGGATAATCC GTATGTGAAG 
TTGCTGGTCG TGTTTGGCCG TGATGATAAA GACCTGTTGC AAGCGGCAAA AGGTATCGCG 
CAAGGGAATA TTCTCTTCCG TGGTTCCAGC GTGGTGGTCA ACGATGTAAA ACCGCTGCTG 
GCGCGCAAAC CGTATGATGC GCCGAACTGG GTGCGTACCG ATCGCCCGGT CACTTTTGGC 
GAGCTGAAAA CCTATGAAGA GCAGCTCCAG TCGAGTGGGC TGGAGCCGGC GCCCATCAAT 
GTTTCTTTGA ATCTGCCGCC GGACCTCTAT TTGCTGCGTA GCAACGGTAT TGATATGGAT 
CTCAACTACC GTTATACCTC GCCGCCGACC AAAGACAGTT CACGACTGGA CATCAGTCTG 
AATAACCAGT TCCTGCAAGC CTTTAGCCTT AACAGCACGC AGGAAACTAA TCGACTCCTG 
TTGCGCTTGC CGGTACTTCA GGGACTGCTG GATGGTAAAA CAGATGTGTC TATTCCGGCG 
CTCAAACTGG GGGCGATGAA CCAACTACGT TTTGACTTCC GCTACATGAA TCCGATGCCG 
GGCGGGTCGG TGGACAACTG TATTACCTTC CAGCCGGTAC CGAATCATGT GGTGATAGGG 
GATGACTCCA CTATCGATTT TTCGAAATAT TACCACTTTA TCGCGATGCC GGATTTACGC 
GCGTTCGCCA ATGCGGGTTT CCCGTTCAGC CGGATGGCCG ACTTGTCTGA CACGCTGGCG 
GTGATGCCGA AGACCCCAAC CGAAGCGCAA ATGGAAACGC TGCTGAATAC GGTCGGTGCC 
ATTGGCGGGC AGACCGGTTT CCCGGCAATT AATCTGACCA TCACCGATGA TAGCGCTCAG 
ATAGCCGACA AAGACGCCGA TCTGCTGATT ATTGGCGCTA TTCCGGGCAA GCTAAAAGAT 
GATAAGCGTA TCGATCTGTT GGTGCAGGCG ACACAAAGCT GGGTAAAAAC CCCGATGCGG 
CAGACCGCTT TCCCGTCGAT TATGCCGGAT GAGGCCGATC GCGCGGCGGA TGCGCAGTCC 
ACCGTCACCG CCAGCGGCCC GATGGCGGCG GTGGTGGGCT TCCAGTCGCC GTTTAATGAT 
CAGCGCAGCG TGATTGCTCT GCTGGCTGAT AGCCCGCGCG GTTACCAGCT ACTGAACGAC 
GCTGTGAACG ACAGCGGTAA ACGCGCCGCG ATGTTTGGTT CCGTGGCGGT GATCCGCGAG 
TCCGGCGTTC ACAGTCTGCG CGTTGGCGAT ATCTATTACG TCGGACATCT GCCGTGGTTT 
GAGCGGCTGT GGTATGCGCT GGCGAATCAC CCGGTGCTGC TGGCGGTACT GGCGGCCCTC 
AGTGTGGTAT TACTGGCGTG GGTATTGTGG CGTCTGCTAC GTATTCTCAG TCGCCGTCGT 
CTCGACCCTG ACCATGAGTA A

Protein sequence

MKRKLSWMCA AVIGLSAFPA FMTAAAPATP PLINAEPTEP APSPATEAPV VAQTAPSREV 
KLTFAQIAPP PGSMALRGVN PNGGIEFGMR SDEVASKAVL NLEYTPSPSL LPVQSQLKVY 
LNDELMGVLP VTKEQLGKKT LAQVPINPLF ITDFNRVRLE FVGHYRDVCE NPASSTLWLD 
IGRNSALDLT YNMLAVNNDL SHFPVPFFEP RDNRPVTLPI VFADMPDLAQ QQAASIVASW 
FGSRAGWRGQ RFPVLYNHLP DRNAIVFATN DRRPDFLRDH PAVNAPVIEM MSHPDNPYVK 
LLVVFGRDDK DLLQAAKGIA QGNILFRGSS VVVNDVKPLL ARKPYDAPNW VRTDRPVTFG 
ELKTYEEQLQ SSGLEPAPIN VSLNLPPDLY LLRSNGIDMD LNYRYTSPPT KDSSRLDISL 
NNQFLQAFSL NSTQETNRLL LRLPVLQGLL DGKTDVSIPA LKLGAMNQLR FDFRYMNPMP 
GGSVDNCITF QPVPNHVVIG DDSTIDFSKY YHFIAMPDLR AFANAGFPFS RMADLSDTLA 
VMPKTPTEAQ METLLNTVGA IGGQTGFPAI NLTITDDSAQ IADKDADLLI IGAIPGKLKD 
DKRIDLLVQA TQSWVKTPMR QTAFPSIMPD EADRAADAQS TVTASGPMAA VVGFQSPFND 
QRSVIALLAD SPRGYQLLND AVNDSGKRAA MFGSVAVIRE SGVHSLRVGD IYYVGHLPWF 
ERLWYALANH PVLLAVLAAL SVVLLAWVLW RLLRILSRRR LDPDHE