Gene SeHA_C3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3372
Symbol
ID	6490487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3281339
End bp	3282823
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	51%
IMG OID	642743505
Product	phenylacetaldehyde dehydrogenase
Protein accession	YP_002047120
Protein GI	194451378
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG TGACATTACT TGCCGAAGTA ACGACTTTTT TACGCCAACG ACACGGACAA 
TTTATTGCAG GTGAACGTCA GGCCGGAAAC GGCACGAACT TCTCGGTCAC TAACCCAGCC 
ACCGGCAAAA TCATCGCCGA CGTTGTGTCG GCAACCCCTG CGCAGGCAGA AGAGGCCATG 
CAGAGCGCCA GACGGGCGTT TGATGTCTGG CGTAAAATGC CAACGTTACA ACGCGGCGCA 
TTACTGCTGA AACTGGCTGA TACTCTTGCC GCTCATCGTG AAGAGTTAGC TCAACTGGAA 
AGCGTCTGTT CAGGTAAAAC GATTATGCTG TCGCGCGGTC TTGAACTCGA TCAGTCAGTG 
GCCTTCCTGC GTTACTTTGC CGGTTGGGCA GGAAAAATAA CCGGTGAAAC GCTGAATGTC 
TCCCTGCCAT CAATGGGAGA AGAGAGATAC ACAGCGTTTA CCCAACGCCA ACCCATTGGC 
GTGGTCGTCG GTATTGTGCC GTGGAATTTC TCAATTATGA TTGCTATCTG GAAACTGGCC 
GCAGCGCTGG TATGTGGCTG CACCATCGTC ATTAAACCAA GTGAATATAC CCCGCTGACA 
CTGCTGCGAG TCGCTGAGCT GGCTAAAGAG GCAGGTTTCC CTGATGGCGT AATTAACGTG 
GTAAACGGTG CTGGCGGTGA GATAGCGCAA CAGCTGATCG CGCATCCAGA TTGCGCCAAA 
GTGAGTTTCA CCGGGTCAGT CGCGACAGGT GAGAAAGTCC GGCGTTCGGC AACATCGTCA 
GGAAAACGCG TTACCCTCGA ACTAGGAGGG AAAAATGCGG CGCTGTTTCT CAATGATCTC 
ACGGCACAAG CCATGGTCAA CGGTATTCTT GAAGCCGGTT ATCTGAATCA AGGGCAAATT 
TGTGCTGCCG CAGAGCGTTT TTATCTGCCC CAGGAAAAAC TGGATACGGT CATGACGCTC 
CTCAGACAAC GGTTATCGGA GATCGTGCCC GGCTCGCCTT TAGATGAAAA AACGGTGATG 
GGCCCGCTGG CGAATCAGGT TCAGCTTGAA AAAGTGCTGC GTCTGATTCA ACGTGCACGG 
GAAGAAGGGG ATACCATTGT TTATGGCGGT GAAACTTTAC CCGGCGAAGG GTACTTTTTA 
CAGCCGACAG CGGTAAAAGT GCGTAGTAAA AACAGTACGC TGATGCACGA GGAGACCTTT 
GGCCCTGTCT GTAGCTTTAT CGGTTATCAG AATGAAAAAG AGGCGCTTTC GCATATCAAC 
GATTCGCCAT TCGGCCTTGC TGCAAGTGTG TGGTCGGAAA ATATATCTAA GGCATTACGC 
TACGCTGAAG ATATTGATGC TGGCATGGTG TGGGTCAATA TGCATACCTT CCTCGATCCC 
GCGGTACCCT TTGGAGGGAT GAAAGGATCG GGCATAGGTC GTGAATTTGG CAGCGCGTTT 
ATTGATGACT ATACCGAACT TAAATCTGTC ATGGTCCGTT ATTAA

Protein sequence

MSDVTLLAEV TTFLRQRHGQ FIAGERQAGN GTNFSVTNPA TGKIIADVVS ATPAQAEEAM 
QSARRAFDVW RKMPTLQRGA LLLKLADTLA AHREELAQLE SVCSGKTIML SRGLELDQSV 
AFLRYFAGWA GKITGETLNV SLPSMGEERY TAFTQRQPIG VVVGIVPWNF SIMIAIWKLA 
AALVCGCTIV IKPSEYTPLT LLRVAELAKE AGFPDGVINV VNGAGGEIAQ QLIAHPDCAK 
VSFTGSVATG EKVRRSATSS GKRVTLELGG KNAALFLNDL TAQAMVNGIL EAGYLNQGQI 
CAAAERFYLP QEKLDTVMTL LRQRLSEIVP GSPLDEKTVM GPLANQVQLE KVLRLIQRAR 
EEGDTIVYGG ETLPGEGYFL QPTAVKVRSK NSTLMHEETF GPVCSFIGYQ NEKEALSHIN 
DSPFGLAASV WSENISKALR YAEDIDAGMV WVNMHTFLDP AVPFGGMKGS GIGREFGSAF 
IDDYTELKSV MVRY