Gene SeAg_B3833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B3833
Symbol	yhjU
ID	6797071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	3723688
End bp	3725367
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	55%
IMG OID	642777957
Product	cellulose synthase operon protein YhjU
Protein accession	YP_002148553
Protein GI	197247918
COG category
COG ID
TIGRFAM ID	[TIGR03368] cellulose synthase operon protein YhjU

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAGC ATACTCAAAC TCCTTCAATG CCTTCTCCGC TCTGGCAGTA CTGGCGCGGT 
CTTTCCGGCT GGAACTTCTA TTTTCTGGTC AAGTTTGGCC TGCTGTGGGC AGGCTATCTG 
AATTTTCATC CTTTACTGAA TTTGGTATTC ATGGCGTTTC TGCTCATGCC AATACCAAAG 
TATCGCCTTC ACCGGTTGCG CCACTGGATT GCCATTCCCG TCGGCTTCGC GCTGTTCTGG 
CATGATACCT GGCTGCCCGG CCCGCAAAGC ATTATGAGTC AGGGGACGCA GGTGGCGGAA 
TTCAGCTCCG GTTATCTGCT CGATCTGATC GCCCGTTTTA TTAACTGGCA AATGATCGGC 
GCCATCTTCG TACTGCTGGT TGCCTGGCTT TTTTTATCAC AGTGGATTCG GGTCACGGTG 
TTTGTGGTCG CCATCATGGT ATGGCTGAAT GTCCTGACAT TAACCGGCCC GGTTTTTACG 
CTGTGGCCGG CAGGCCAGCC AACCGATACG GTGACGACGA CTGGCGGTAA TGCGGCCGCT 
ACCGTCGCGA CAGCGGGCGA TAAGCCGGTC ATCGGCGATA TGCCTGCGCA AACCGCGCCG 
CCGACGACCG CGAATCTGAA CGCCTGGTTG AACACCTTCT ATGCCGCGGA AGAAAAGCGG 
AAAACGACGT TCCCGGCGCA GCTTCCGCCT GATGCGCAGC CGTTCGACCT ATTGGTCATC 
AATATTTGTT CGCTCTCCTG GTCGGATGTC GAAGCGGCAG GCTTGATGTC ACATCCGCTA 
TGGTCGCACT TTGACATTTT GTTTAAACAC TTTAATTCCG GCACGTCTTA CAGCGGCCCG 
GCGGCCATTC GTCTGCTGCG CGCCAGCTGT GGTCAACCAT CGCATACCCG ACTTTATCAA 
CCAGCCGATA ACGAATGTTA TCTGTTTGAT AATCTGGCGA AACTGGGCTT TACTCAGCAT 
CTGATGATGG ATCATAACGG TGAATTTGGC GGCTTCCTGA AAGAAGTTCG CGAAAACGGC 
GGTATGCAGA GCGAACTGAT GAACCAGTCC GGCCTGCCAA CCGCCCTGCT GTCATTCGAC 
GGCTCGCCGG TATATGACGA TTTGGCGGTC CTGAACCGCT GGTTGGCAGG GGAAGAACGT 
GAAGCCAATT CCCGCTCCGC GACTTTCTTT AACCTGCTGC CGCTGCACGA TGGCAACCAT 
TTCCCCGGCG TCAGCAAAAC GGCGGATTAT AAAATCCGCG CGCAGAAACT GTTCGATGAA 
CTGGACGCCT TCTTTACCGA ACTGGAGAAA TCCGGGCGTA AGGTGATGGT GGTCGTCGTA 
CCGGAGCACG GCGGCGCGCT GAAGGGCGAC AGAATGCAGA TATCAGGCCT GCGCGATATT 
CCCAGCCCCT CCATCACCAA CGTCCCGGCG GGCGTGAAAT TTTTTGGCAT GAAAGCCCCG 
CATGAGGGCG CGCCGATTGA TATTAATCAG CCGAGCAGCT ACCTGGCGAT TTCCGAACTG 
GTCGTACGCG CCGTGGACGG TAAGCTCTTT ACCGAAGACA GTGTGAACTG GAACAAGCTG 
ACCAGCAATC TGCCGCAAAC CGCGCCGGTT TCAGAAAACG CTAATGCGGT GGTGATTCAG 
TACCAGGGTA AGCCCTACGT TCGTCTGAAT GGCGGCGACT GGGTGCCTTA CCCGCAGTAA

Protein sequence

MTQHTQTPSM PSPLWQYWRG LSGWNFYFLV KFGLLWAGYL NFHPLLNLVF MAFLLMPIPK 
YRLHRLRHWI AIPVGFALFW HDTWLPGPQS IMSQGTQVAE FSSGYLLDLI ARFINWQMIG 
AIFVLLVAWL FLSQWIRVTV FVVAIMVWLN VLTLTGPVFT LWPAGQPTDT VTTTGGNAAA 
TVATAGDKPV IGDMPAQTAP PTTANLNAWL NTFYAAEEKR KTTFPAQLPP DAQPFDLLVI 
NICSLSWSDV EAAGLMSHPL WSHFDILFKH FNSGTSYSGP AAIRLLRASC GQPSHTRLYQ 
PADNECYLFD NLAKLGFTQH LMMDHNGEFG GFLKEVRENG GMQSELMNQS GLPTALLSFD 
GSPVYDDLAV LNRWLAGEER EANSRSATFF NLLPLHDGNH FPGVSKTADY KIRAQKLFDE 
LDAFFTELEK SGRKVMVVVV PEHGGALKGD RMQISGLRDI PSPSITNVPA GVKFFGMKAP 
HEGAPIDINQ PSSYLAISEL VVRAVDGKLF TEDSVNWNKL TSNLPQTAPV SENANAVVIQ 
YQGKPYVRLN GGDWVPYPQ