Gene SeAg_B4853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4853
Symbol
ID	6793847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	4730628
End bp	4731998
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	57%
IMG OID	642778917
Product	aldehyde dehydrogenase (NAD) family protein
Protein accession	YP_002149478
Protein GI	197251125
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTACC AGACAGTGAA TCCTGCCAAT AATCAGCTCA TTAAAGAGTA TCCCCCGCAT 
ACGGACGCGG ATATTGAAGC CGCGCTGCAA AAAGCTGACG CGCTCTATCA CTCCGACTGG 
TCCAGGGGAG AGATTGACCA ACGTCTGCCG GTACTGCATA AGCTGGCTGA CTTGATCGAC 
AGCCGTGTTG AAGAACTGGC AAAAATCGCC AGCCAGGAGA TGGGCAAGCT CATCGAGCAG 
AGCCGTGGCG AAGTCAAACT GTGTGCGCAG ATCGCTCGCT ATTATGCGGA TAACGCGAAG 
CAGTTTCTTG CCCCGGTGCC TTATAAAACC GAGTTTGGCG ACGCGTGGGT AGAACATCAT 
CCGATTGGCG TCATCATGGC CGTTGAGCCG TGGAACTTCC CGTACTATCA GTTGATGCGT 
GTGCTGGCGC CGAACCTGGC CGCTGGTAAC CCGGTGCTGG CGAAACATGC CAGCATCGTA 
CCGCACTGCG CCGAGACGTT TGCCCATCTG GTGCGTGAAG CCGGCGCGCC GGAAGGCGCA 
TGGACCAACC TGTTTATTTC CTCCGATCAG GTGGCGAATA TCATCGCCGA CCCGCGCGTG 
CAGGGCGCGG CGCTGACCGG ATCTGAAAAA GCGGGGAGCG CCGTGGCGGC ACAGGCGGCG 
AAGCACATTA AAAAATCGAC GCTGGAACTG GGCGGGAACG ATGTGTTCGT CGTGCTGGAC 
GATGCCGATC TTGAGAAAGC GGTGAAAATT GGCGTGCAGG CACGGCTCAC TAATGCAGGA 
CAGGTATGTA CGGCGGCGAA GCGCTTTATC CTGCATGAGA AAATCGCCGA TCAATTCCTC 
AGCCAGTTCA CCGAGGCGTT CAGGAAGGTG AAGGTGGGGG ATCAGATGGA TGCTTCTACC 
GAACTGGGGC CGCTGTCGTC GAAAGATGCG CTGGATACAT TGACCAGACA GGTCGAGGAA 
GCGGTGAAAA ATGGCGCGAC GCTGCACGTT GGCGGCAAGC CGCTGGAAAG CAAAGGCAAC 
TTCTTTGAGC CGACGATTCT GACCAATATT ACGCGTGACA ACCCGGCGTA CTTTGAAGAG 
TTCTTCGGCC CGGTGGCGCA GATGTATGTG GTGAAAGACG ATGACGAGGC GGTAAAACTC 
GCCAACGATT CCCACTACGG CCTGGGCGGC GCGGTGTTTA GTCAGGATAT TGAGCGTGCT 
AAACGCATGG CCTCCCGGAT TGAAACCGGG ATGGTTTATA TCAACTGGCT GACCGACACC 
GCAGCGGAGC TGCCTTTCGG CGGCGTTAAG CGTTCGGGCT TCGGACGCGA GCTATCGGAT 
CTGGGGATTA AGGAGTTTGT GAACCAGAAG CTGGTAGTGG TGCGCCGCTA A

Protein sequence

MAYQTVNPAN NQLIKEYPPH TDADIEAALQ KADALYHSDW SRGEIDQRLP VLHKLADLID 
SRVEELAKIA SQEMGKLIEQ SRGEVKLCAQ IARYYADNAK QFLAPVPYKT EFGDAWVEHH 
PIGVIMAVEP WNFPYYQLMR VLAPNLAAGN PVLAKHASIV PHCAETFAHL VREAGAPEGA 
WTNLFISSDQ VANIIADPRV QGAALTGSEK AGSAVAAQAA KHIKKSTLEL GGNDVFVVLD 
DADLEKAVKI GVQARLTNAG QVCTAAKRFI LHEKIADQFL SQFTEAFRKV KVGDQMDAST 
ELGPLSSKDA LDTLTRQVEE AVKNGATLHV GGKPLESKGN FFEPTILTNI TRDNPAYFEE 
FFGPVAQMYV VKDDDEAVKL ANDSHYGLGG AVFSQDIERA KRMASRIETG MVYINWLTDT 
AAELPFGGVK RSGFGRELSD LGIKEFVNQK LVVVRR