Gene SNSL254_A3119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3119
Symbol
ID	6483319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3035290
End bp	3036240
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	56%
IMG OID	642738431
Product	NAD-dependent epimerase/dehydratase:Short-chain dehydrogenase/reductase SDR:3-beta hydroxysteroid dehydrogenase/isomerase:dTDP-4-dehydrorhamnose reductase
Protein accession	YP_002042155
Protein GI	194442216
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.0293341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATTA TCATTACCGG CGGGGGCGGC TTTTTAGGCC AGAAACTCGC AAGCGCCTTA 
TTAAACTCAT CGCTGGCGTT TAACGAACTG CTTCTTGTTG ATTTAAAAAT GCCTGCACGG 
TTATCAGATT CCCCTCGTTT ACGCTGCCTG GAAGCTGACT TAACCCAGCC GGGCGTGCTG 
GAGAATGTGA TTACCGCTAA TACCTCTGTT GTTTATCATC TCGCTGCGAT TGTCAGCAGT 
CATGCGGAAG ACGATTTTGA TCTGGGATGG AAAGTTAACC TGGATCTTAC CCGCCAGTTA 
CTTGAGGCGT GTCGTTGGCA ACCGCAGAAA ATTCGTTTTG TCTTCTCCAG CTCGCTTGCC 
GTTTATGGCG GTACGCTGCC GGAATGCGTC ACCGATACCA CCGCGCTCAC GCCGCGCTCG 
TCTTATGGCG CGCAGAAGGC CGCCTGTGAA CTGTTGGTCA ACGACTATAC CCGCAAAGGC 
TATGTGGATG GGCTGGCGCT GCGTTTGCCG ACGATCTGTG TTCGCCCGGG TAAACCAAAC 
CGCGCCGCTT CTTCTTTTGT CAGCGCGATT ATTCGTGAAC CGTTGCAGGG CGAGACGACC 
GTCTGCCCGG TGTCGGAAAG TTTGCGGCTG TGGATTTCCA GCCCGGCGAC GGTGATCCAT 
AACCTGTCGC TGGCCGCAAC GTTACCCGCG CCTGGCGAGG CGAGCAGCAT CAACTTACCG 
GGGATCAGCG TAACCGTGGG CGAGATGCTG GAAACGTTGC GTCAGGCGGG CGGCCAGGCG 
GCGCGCGATC GGGTTACGCA TCAGCGCGAT GAAGGCGTCG AGAAAATTGT CGCCTCCTGG 
CCGGGACGTA TCGATAACCA GCGTGCGCTG GCGTTAGGTT TTGTCGCCGA TAAACGCTTC 
GATGACATTA TCGAACGCTT TCGACAAGAT GATATGGAGG GGAGGTCATG A

Protein sequence

MQIIITGGGG FLGQKLASAL LNSSLAFNEL LLVDLKMPAR LSDSPRLRCL EADLTQPGVL 
ENVITANTSV VYHLAAIVSS HAEDDFDLGW KVNLDLTRQL LEACRWQPQK IRFVFSSSLA 
VYGGTLPECV TDTTALTPRS SYGAQKAACE LLVNDYTRKG YVDGLALRLP TICVRPGKPN 
RAASSFVSAI IREPLQGETT VCPVSESLRL WISSPATVIH NLSLAATLPA PGEASSINLP 
GISVTVGEML ETLRQAGGQA ARDRVTHQRD EGVEKIVASW PGRIDNQRAL ALGFVADKRF 
DDIIERFRQD DMEGRS