Gene SeSA_A4739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4739
Symbol
ID	6519263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	4604015
End bp	4605046
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	50%
IMG OID	642749671
Product	L-idonate 5-dehydrogenase
Protein accession	YP_002117404
Protein GI	194734309
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.130148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGTAA AAACTCAATC CTGCGTTGTT GCGGGTAAGC GTGCTGTTGC CGTTACGGAA 
CAAAATATTG AATGGAATAA TAAAGGAACA CTCGTACAAA TTACCCGAGG CGGCATTTGT 
GGGTCTGACT TACATTATTA TCAGGAAGGC AAAGTCGGCA ATTTTACAGT AAAAGCGCCA 
ATGATTTTAG GTCATGAAGT GATTGGCAAA ATCGTTCATA GCGACTCAGA TTTATTACGT 
GAAGGACAAC CGGTAGCGAT TAATCCATCG AAGCCTTGCG GTCATTGCAA ATACTGTCTG 
CAGCATGAAG AAAACCACTG TACTGAAATG CGTTTCTTTG GCAGCGCCAT GTATTTTCCG 
CATGTCGATG GCGGTTTTAC CCGATTTAAA TCTGTCGATA CCGTTCAGTG CATTCCCTGG 
CCGGAACAGG CAGACGAAAA AGCCATGGCC TTTGCCGAAC CGCTGGCGGT TGCCATTCAT 
GCGGCTCATG AGGCGGGCGA TCTGCAAGGC AAACGCGTCT TTATCTCCGG CGTTGGCCCT 
ATCGGCTGCC TGATTGTTAG CGCGGTAAAA ACGCTGGGCG CAGCGGAAGT GGTATGTGCT 
GATATCAGTA CCCGTTCTCT CTCGCTGGCC CGGCAGATGG GCGCGGATAC GCTGGTAAAC 
CCACAGCATG ACTCTCTTGA TGGCTGGAAA GCAGAAAAAG GGTATTTCGA TATCAGTTTT 
GAAGTCTCCG GGCATCCTTC CTCAATCTCA ACGTGTCTGG AAGTCACACG GGCAAAAGGC 
GTGATGGTGC AGGTTGGCAT GGGCGGCGCA GTCCCCAACT TCCCGATGAT GATGGTAATA 
AGCAAAGAGA TCTCCCTGAA AGGCTCTTTC CGCTTTACTA CCGAATTTAA TACTGCGGTT 
TCCTGGCTTG CCAACCGCGT TATCAATCCG CTGCCGTTAC TGAGCGCGGA ATATCCATTT 
ACCGACCTGG AAGCGGCGCT GATCTTTGCC GGAGACAAAA CACAGGCGGC AAAAGTTCAG 
CTCGTTTTCT GA

Protein sequence

MEVKTQSCVV AGKRAVAVTE QNIEWNNKGT LVQITRGGIC GSDLHYYQEG KVGNFTVKAP 
MILGHEVIGK IVHSDSDLLR EGQPVAINPS KPCGHCKYCL QHEENHCTEM RFFGSAMYFP 
HVDGGFTRFK SVDTVQCIPW PEQADEKAMA FAEPLAVAIH AAHEAGDLQG KRVFISGVGP 
IGCLIVSAVK TLGAAEVVCA DISTRSLSLA RQMGADTLVN PQHDSLDGWK AEKGYFDISF 
EVSGHPSSIS TCLEVTRAKG VMVQVGMGGA VPNFPMMMVI SKEISLKGSF RFTTEFNTAV 
SWLANRVINP LPLLSAEYPF TDLEAALIFA GDKTQAAKVQ LVF