Gene SeHA_C3854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3854
Symbol
ID	6490574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3727514
End bp	3728551
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	51%
IMG OID	642743962
Product	putative dehydrogenase
Protein accession	YP_002047568
Protein GI	194450188
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTAC ACTGCGCATT TATTGGATTC GGCAAAAGTA CCACCCGTTA CCATCTCCCC 
TATGTTCTGA ATCGGAAAGA TACCTGGCAT GTCGCGCATA TTTTCCGTCG TCACGCTAAA 
CCGGAAGAGC AGGCGCCGCA GTATTCGCAT ATTCACTTCA CCAGCGATCT GGATGAGGTG 
TTGGGCGATC CGCAGGTAAA ACTGGTGATC GTCTGTACGC ATGCTGACAG CCATTTCGAA 
TACGCTAAAC GCGCGCTGGA AGCGGGTAAA AATGTGCTGG TTGAGAAACC TTTCACGCCG 
ACGCTGGCGG AGGCAAAAGT GTTGTTCGAC CTGGCGCGAA GCAAAGGACT GACCGTCACG 
CCGTATCAGA ATCGGCGTTT TGATTCCTGT TTTCTCACTG CTAAAAAAGC GATTGAGAGC 
GGGAAACTGG GCAAGATTGT CGAAGTTGAA AGCCATTTTG ACTACTACCG ACCCGTGGCG 
GAAACCAAAC CGGGCCTGCC GCAGGATGGC GCTTTCTACG GACTTGGCGT CCACACTATG 
GATCAAATTA TTTCGCTATT TGGCCGCCCG GATCATGTCG CGTATGACAT TCGTAGCCTG 
CGTAATAAAG CGAATCCGGA TGACACCTTT GAAGCGCAAT TGTTCTACGG TGACCTGAAA 
GCCATTGTGA AAACCAGCCA TCTGGTGAAA ATCGACTATC CGAAGTTTAT TGTTCACGGC 
ACCAAAGGTT CGTTTGTGAA ATACGGTATC GATCAACAAG AAACCAGCCT GAAAGCGAAC 
ATTATGCCTG GTGAACCCGG TTTCGCCGCT GACGAATCCG TCGGCGTGCT GGAGTATGTC 
AATGACGACG GCGTTACGGT GAAAGAAGAG GTGAAACCGG AAACGGGTGA CTATGGTCGC 
GTCTATGATG CGCTGTACCA GACGTTGACC GTCGGTACGC CTAATTACGT CAAGGAATCT 
GAAGTTCTTA CCAACCTGGA AATCCTCGAA CGTGCCTTCG AACAGGCAAC GCCTGCGACG 
ATAACCCTGG CTAAATAG

Protein sequence

MTLHCAFIGF GKSTTRYHLP YVLNRKDTWH VAHIFRRHAK PEEQAPQYSH IHFTSDLDEV 
LGDPQVKLVI VCTHADSHFE YAKRALEAGK NVLVEKPFTP TLAEAKVLFD LARSKGLTVT 
PYQNRRFDSC FLTAKKAIES GKLGKIVEVE SHFDYYRPVA ETKPGLPQDG AFYGLGVHTM 
DQIISLFGRP DHVAYDIRSL RNKANPDDTF EAQLFYGDLK AIVKTSHLVK IDYPKFIVHG 
TKGSFVKYGI DQQETSLKAN IMPGEPGFAA DESVGVLEYV NDDGVTVKEE VKPETGDYGR 
VYDALYQTLT VGTPNYVKES EVLTNLEILE RAFEQATPAT ITLAK