Gene SeHA_C4050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4050
Symbol	waaA
ID	6488726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3932348
End bp	3933625
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	55%
IMG OID	642744151
Product	3-deoxy-D-manno-octulosonic-acid transferase
Protein accession	YP_002047756
Protein GI	194449972
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1519] 3-deoxy-D-manno-octulosonic-acid transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.863642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGAAT TGCTTTACAC CGCTCTTCTC TACCTTATTC AGCCTCTGAT CTGGATACGG 
CTTTGGGTGC GTGGACGTAA AGCGCCGGCC TATCGTAAGC GCTGGGGTGA ACGCTACGGA 
TTCTACCGCC GTCCGTTGAA ACCGGGCGGA ATCATGCTGC ATTCCGTCTC GGTGGGCGAA 
ACTCTGGCGG CCATCCCATT GGTCCGCGCT CTACGTCATC GCTATCCCGA TCTGCCTATT 
ACCGTAACGA CCATGACGCC GACCGGCTCG GAGCGCGTCC AGTCCGCCTT TGGCAACGAT 
GTTCAGCACG TTTACTTGCC TTATGATTTG CCCGATGCGC TCAATCGTTT CCTCAATAAG 
ATTGATCCTA AGCTGGTATT GATCATGGAG ACTGAGCTCT GGCCAAATCT GATTGCTGCG 
CTGCACAAAC GTCATATTCC GCTGGTTATC GCTAATGCGC GGCTTTCCGC CCGCTCCGCC 
GCGGGTTATG CGAAGCTTGG CAAGTTTGTC CGTACGCTCT TGCGCCGTAT CACCCTGATT 
GCCGCGCAAA ACGAAGAAGA TGGCGAACGC TTTGTGGCAT TGGGCGCGAA GAACAATCAG 
GTCACGGTCA CCGGCAGTCT GAAATTTGAT ATTTCAGTTA CGCCGCAGCT GGCGGCTAAA 
GCCGTTACGC TACGCCGCCA GTGGGCGCCG CACCGTCCGG TCTGGATTGC CACCAGCACC 
CACGATGGCG AAGAGAGTAT CGTTATCGCC GCTCACCAGG CGTTATTACA TCAATTCCCG 
AATTTATTAC TGATTCTGGT GCCCCGCCAT CCGGAGCGTT TCCCGGATGC TATCAATCTT 
GTGCGTCAGG CAGGGTTAAG CTACATCACT CGTTCTTCGG GCGAAGTACC GTCCGCCAGC 
ACCCAGGTCG TGGTAGGCGA TACCATGGGC GAATTAATGT TGCTCTATGG CATTGCCGAT 
CTCGCCTTTG TTGGTGGTTC GCTGGTTGAA CGCGGCGGTC ATAACCCGCT GGAGGCCGCC 
GCTCATGCGA TTCCGGTACT GATGGGTCCG CATACCTTTA ACTTTAAAGA TATTTGCGCC 
CGTCTGGATC AGGCGAGCGG ACTTATCACG ATTACCGATG CGGCTACGCT GGCAAAAGAA 
GTTTCCTCTT TACTGACCGA CGCTGATTAT CGTAATTTCT ACGGACGTCA CGCAGTTGAA 
GTGCTGTATC AAAATCAGGG CGCGCTCCAG CGTCTGCTGC AACTGCTGGA ACCTTATCTG 
CCACCGAAAA CGCATTGA

Protein sequence

MLELLYTALL YLIQPLIWIR LWVRGRKAPA YRKRWGERYG FYRRPLKPGG IMLHSVSVGE 
TLAAIPLVRA LRHRYPDLPI TVTTMTPTGS ERVQSAFGND VQHVYLPYDL PDALNRFLNK 
IDPKLVLIME TELWPNLIAA LHKRHIPLVI ANARLSARSA AGYAKLGKFV RTLLRRITLI 
AAQNEEDGER FVALGAKNNQ VTVTGSLKFD ISVTPQLAAK AVTLRRQWAP HRPVWIATST 
HDGEESIVIA AHQALLHQFP NLLLILVPRH PERFPDAINL VRQAGLSYIT RSSGEVPSAS 
TQVVVGDTMG ELMLLYGIAD LAFVGGSLVE RGGHNPLEAA AHAIPVLMGP HTFNFKDICA 
RLDQASGLIT ITDAATLAKE VSSLLTDADY RNFYGRHAVE VLYQNQGALQ RLLQLLEPYL 
PPKTH