Gene SNSL254_A3946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3946
Symbol
ID	6483276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3827989
End bp	3828987
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	55%
IMG OID	642739206
Product	2,3-diketo-L-gulonate reductase
Protein accession	YP_002042916
Protein GI	194443785
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAA CTTTCGAAGA GTTAAAAGGG GCCTTCTACC GCGTCTTGCG GTCGCGGAAT 
ATTGCGGAAG ATACCGCCGA CAAGTGCGCG GAAATGTTCG CTCGCACCAC CGAGTCCGGT 
GTCTATTCCC ACGGCGTGAA CCGCTTTCCT CGCTTCATCC AGCAACTGGA TAACGGCGAC 
ATTATTCCTG ATGCTAAACC GCAGCGGGTT ACCAGCCTCG GCGCCATCGA ACAGTGGGAT 
GCTCAGCGCG CTATCGGCAA CCTGACGGCG AAAAAGATGA TGGACCGGGC CATCGAGCTG 
GCTTCCGATC ATGGTATTGG CCTGGTGGCG TTACGTAATG CTAACCACTG GATGCGCGGC 
GGCAGCTACG GCTGGCAGGC GGCGGAAAAA GGCTATATCG GCATTTGCTG GACCAACTCC 
ATCGCCGTCA TGCCGCCGTG GGGGGCGAAA GAGTGCCGTA TCGGTACCAA TCCGCTGATC 
GTCGCCATTC CGTCTACGCC GATCACGATG GTAGATATGT CGATGTCGAT GTTCTCCTAC 
GGAATGTTAG AAGTTAACCG TCTGGCGGGC CGCGAACTGC CGGTGGATGG CGGTTTCGAC 
GATAACGGTC AGTTGACCAA AGAACCGGGC GTTATCGAGA AAAATCGCCG CATTTTACCA 
ATGGGTTACT GGAAAGGATC TGGTCTGTCG ATTGTGCTGG ACATGATTGC CACCCTGCTT 
TCTAACGGTT CTTCCGTTGC CGAAGTGACC CAGGAAAACA GCGATGAGTA TGGCGTCTCA 
CAGATTTTCA TCGCCATAGA AGTGGATAAG CTGATCGATG GCGCAACCCG CGATGCCAAA 
CTGCAGCGGA TTATGGATTT CATCACCACT GCTGAACGCG CCGACGACAA CGTCGCGATT 
CGGCTGCCCG GCCACGAATT TACCAAATTG CTGGATGACA ACCGCCGTCA CGGTATCACC 
ATTGACGACA GCGTCTGGGC CAAAATTCAG GCGCTGTAA

Protein sequence

MKVTFEELKG AFYRVLRSRN IAEDTADKCA EMFARTTESG VYSHGVNRFP RFIQQLDNGD 
IIPDAKPQRV TSLGAIEQWD AQRAIGNLTA KKMMDRAIEL ASDHGIGLVA LRNANHWMRG 
GSYGWQAAEK GYIGICWTNS IAVMPPWGAK ECRIGTNPLI VAIPSTPITM VDMSMSMFSY 
GMLEVNRLAG RELPVDGGFD DNGQLTKEPG VIEKNRRILP MGYWKGSGLS IVLDMIATLL 
SNGSSVAEVT QENSDEYGVS QIFIAIEVDK LIDGATRDAK LQRIMDFITT AERADDNVAI 
RLPGHEFTKL LDDNRRHGIT IDDSVWAKIQ AL