Gene SeD_A3999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3999
Symbol
ID	6871501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3844451
End bp	3846010
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	53%
IMG OID	642786955
Product	hypothetical protein
Protein accession	YP_002217583
Protein GI	198245216
COG category
COG ID
TIGRFAM ID	[TIGR03369] cellulose biosynthesis protein BcsE

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.366924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACCCCG TATTTTCTCT CGGCATCTCA TCATTATGGG ATGAACTGCG CCATATGCCA 
ACCGGCGGCG TCTGGTGGGT TAACGCCGAT CGCCAGCAAG ATGCCATCAG CCTGGTGAAT 
CAAACGATTG CGTCACAAAC GGAGAATGCA AATGTCGCCG TCATCGGCAT GGAAGGCGAT 
CCTGGCAAAG TAATCAAATT AGATGAATCT CACGGTCCGG AGAAAATCCG CTTATTTACC 
ATGCCGGATT CAGAAAAAGG GCTATACTCT TTGCCCCACG ATTTGCTTTG TTCTGTTAAC 
CCGACGCATT ACTTTTTCAT TCTTATTTGT GCAAATAACA CGTGGCGGAA TATAACGTCA 
GAAAGCCTGC ATAAATGGCT GGAAAAAATG AATAAATGGA CTCGTTTTCA TCACTGTTCA 
TTGTTGGTTA TTAACCCTTG TAATAATAGC GATAAACAGT CCTCGTTGTT GATGGGCGAG 
TATCGCTCAC TTTTCGGCCT CGCCAGTTTA CGTTTTCAGG GCGACCAACA TTTGTTCGAT 
ATTGCCTTCT GGTGTAACGA AAAAGGCGTC AGCGCCCGAC AGCAGTTATT GCTGTGTCAG 
CAGGACGAAC GCTGGACGCT ATCCCATCAG GAGGAGACGG CAATTCAGCC GCGTAGCGAC 
GAAAAACGCA TTCTTAGCCA CGTCGCCGTC CTTGAAGGCG CGCCGCCGCT CTCGGAACAC 
TGGACGCTTT TCGACAATAA CGAAGCGCTA TTCAACGACG CGCGCACGGC GCAGGCCGCG 
ACAATTATTT TTTCGCTTAC ACAGAACAAC CAAATCGAGC CGCTTGCTCG TCGCATTCAT 
ACTTTGCGGC GCCAGCGGGG AAGCGCGCTG AAAATTGTCG TGCGCGAAAA TATCGCCAGT 
TTGCGCGCCA CCGATGAGCG CCTGCTGCTG GGCTGCGGCG CGAATATGAT CATTCCCTGG 
AACGCCCCGC TTTCACGCTG CCTGACGCTT ATTGAAAGCG TGCAGGGACA GCAGTTCAGC 
CGTTACGTAC CGGAAGACAT CACCACGCTA CTGTCAATGA CGCAGCCGTT GAAACTGCGC 
GGTTTTCAGC CGTGGGATAT CTTCTGCGAT GCCATCCATA CGATGATGAG CAACACCCTG 
CTCCCCGCCG ACGGGAAAGG CGTTCTGGTC GCGCTGCGCC CGGTGCCGGG CATTCGGGTT 
GAGCAGGCGT TAACATTATG TCGGCCAAAC CGAACCGGCG ATATTATGAC CATCGGCGGC 
AACCGTCTGG TGCTGTTTTT ATCATTCTGC CGGGTCAACG ATCTGGATAC CGCGTTAAAC 
CATATTTTCC CTTTGCCGAC GGGCGATATT TTCTCTAATC GTATGGTCTG GTTCGAAGAT 
AAACAAATCA GCGCCGAGCT GGTGCAGATG CGCTTATTGT CGCCGGAACT GTGGGGAACG 
CCGCTACCGC TGGCAAAACG CGCCGACCCG GTAATAAATG CCGAACACGA TGGCCGCATC 
TGGCGTCGTA TTCCTGAACC CCTGCGATTG CTCGACGACA CCGCGGAGCG TGCATCATGA

Protein sequence

MDPVFSLGIS SLWDELRHMP TGGVWWVNAD RQQDAISLVN QTIASQTENA NVAVIGMEGD 
PGKVIKLDES HGPEKIRLFT MPDSEKGLYS LPHDLLCSVN PTHYFFILIC ANNTWRNITS 
ESLHKWLEKM NKWTRFHHCS LLVINPCNNS DKQSSLLMGE YRSLFGLASL RFQGDQHLFD 
IAFWCNEKGV SARQQLLLCQ QDERWTLSHQ EETAIQPRSD EKRILSHVAV LEGAPPLSEH 
WTLFDNNEAL FNDARTAQAA TIIFSLTQNN QIEPLARRIH TLRRQRGSAL KIVVRENIAS 
LRATDERLLL GCGANMIIPW NAPLSRCLTL IESVQGQQFS RYVPEDITTL LSMTQPLKLR 
GFQPWDIFCD AIHTMMSNTL LPADGKGVLV ALRPVPGIRV EQALTLCRPN RTGDIMTIGG 
NRLVLFLSFC RVNDLDTALN HIFPLPTGDI FSNRMVWFED KQISAELVQM RLLSPELWGT 
PLPLAKRADP VINAEHDGRI WRRIPEPLRL LDDTAERAS