Gene SeSA_A4130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4130
Symbol
ID	6517203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	4006848
End bp	4007894
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	52%
IMG OID	642749098
Product	lipopolysaccharide biosynthesis protein WzzE
Protein accession	YP_002116854
Protein GI	194736042
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3765] Chain length determinant protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAAC CATTACCGGG GGCACGCGCG GTGAGCGCTG AAAATGAACT GGATATTCGC 
GGGTTGTTTC GTACTTTATG GGCTGGCAAA TTCTGGATTA TCGGCATTGG CCTGCTATTT 
GCCCTTATCG CGTTAGCCTA TACCTTTTTT GCTCGTCAGG AGTGGAGTGC GACGGCGATC 
ACCGATCGCC CAACCGTAAA TATGTTGGGC GGTTATTACT CCCAGCAGCA GTTTCTGCGC 
AACCTGGATA TTAAGACCGA TCCTGCTTCT TCCGATAAAC CCTCGGTGAT GGATGAAGCG 
TATAAAGAGT TCATCATGCA ACTTGCCTCC TGGGATACGC GTCGCGATTT CTGGTTACAG 
ACGGACTATT ACAAGCAGCG AATGGTCGGG AATAGCAAAG CTGATGCGGC GATGCTTGAT 
GAACTGATCA ATAACATACA GTTTACGCCC GGCGATTTTA CACGCGCCAT CAACGACAAT 
GTGAAGCTGA TTGCTGAAAC TGCGCCGGAC GCCAATAATC TGCTGCGTCA GTATGTCGCA 
TTCGCCAGCC AGCGGGCGGC GAGCCATCTG AATGATGAAT TAAAAGGCGC CTGGGCTGCG 
CGTACCGTGC AGATGAAAGC GCAGGTCAAA CGGCAGGAAG AGGTTGCGAA AGCGATCTAT 
TCACGTCGTG TAAACAGTAT TGAGCAGGCG CTCAAAATTG CGGAACAACA TAATATTTCT 
CGTAGCGCGA CGGATGTCCC GGCGGATGAA TTACCGGACT CAGAGCTTTT TTTACTCGGT 
CGCCCTATGT TGCAGGCGCG TCTTGAAAAT CTGCAAGCGG TTGGCCCTGC GTTCGATTTG 
GACTACTTTC AAAATCGGGC AATGTTGAAT ACGCTTAATG TGGGGCCGAC CCTGGACCCT 
CGTTTTCAGA CCTATCGTTA TTTGCGTACG CCGGAAGAAC CGGTAAAACG TGATAGCCCA 
CGCCGAGCCT TCCTGATGAT TATGTGGGGT ATCGTTGGGG CGCTAATCGG TGCGGGCGTT 
GCCTTAACCC GTCGCCGCAC GATTTAG

Protein sequence

MTQPLPGARA VSAENELDIR GLFRTLWAGK FWIIGIGLLF ALIALAYTFF ARQEWSATAI 
TDRPTVNMLG GYYSQQQFLR NLDIKTDPAS SDKPSVMDEA YKEFIMQLAS WDTRRDFWLQ 
TDYYKQRMVG NSKADAAMLD ELINNIQFTP GDFTRAINDN VKLIAETAPD ANNLLRQYVA 
FASQRAASHL NDELKGAWAA RTVQMKAQVK RQEEVAKAIY SRRVNSIEQA LKIAEQHNIS 
RSATDVPADE LPDSELFLLG RPMLQARLEN LQAVGPAFDL DYFQNRAMLN TLNVGPTLDP 
RFQTYRYLRT PEEPVKRDSP RRAFLMIMWG IVGALIGAGV ALTRRRTI