Gene SeHA_C3103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3103
Symbol
ID	6489443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3031647
End bp	3032597
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	56%
IMG OID	642743253
Product	NAD dependent epimerase/dehydratase family protein
Protein accession	YP_002046872
Protein GI	194450353
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATTA TCATTACCGG CGGGGGCGGC TTTTTAGGCC AGAAACTCGC AAGCGCCTTA 
TTAAACTCAT CGCTGGCGTT TAACGAACTG CTTCTTGTTG ATTTAAAAAT GCCTGCACGG 
TTATCAGATT CCCCTCGTTT ACGCTGCCTG GAAGCTGACT TAACCCAGCC GGGCGTGCTG 
GAGAATGTGA TTACCGCTAA TACCTCTGTT GTTTATCATC TCGCTGCGAT TGTCAGCAGT 
CATGCGGAAG ACGATTTTGA TCTGGGATGG AAAGTTAACC TGGATCTTAC CCGCCAGTTA 
CTTGAGGCGT GTCGTCGACA ACCGCAGAAA ATTCGTTTTG TCTTCTCCAG CTCGCTTGCC 
GTTTATGGCG GTACGCTGCC GGAATGCGTC ACCGATACCA CCGCGCTCAC GCCGCGCTCG 
TCTTATGGCG CGCAGAAGGC CGCCTGTGAA CTGTTGGTCA ACGATTATAC CCGCAAAGGC 
TATGTGGATG GGCTGGCGCT GCGTTTGCCG ACGATCTGTG TTCGCCCGGG TAAACCAAAC 
CGCGCCGCTT CTTCTTTTGT CAGCGCGATT ATTCGTGAAC CGTTGCAGGG CGAGACGACC 
GTCTGCCCGG TGTCGGAAAG TTTGCGTCTG TGGATTTCCA GCCCGGCGAC GGTGATCCAT 
AACCTGTCGC TGGCCGCAAC GTTACCCGCG CCTGGCGAGG CGAGCAGCAT CAACTTACCC 
GGGATCAGCG TAACCGTGGG CGAGATGCTG GAAACGTTGC GTCAGGCGGG CGGTCAGGCG 
GCGCGCGATC GGGTTACGCA TCAGCGCGAC GAAGGCGTCG AGAAAATTGT CGCCTCCTGG 
CCGGGACGTA TCGATAACCA GCGTGCGCTG GCGTTAGGTT TTGTCGCCGA TAAACGCTTC 
GATGACATTA TCGAACGCTT TCGACAAGAT GATATGGAGG GGAGGTCATG A

Protein sequence

MQIIITGGGG FLGQKLASAL LNSSLAFNEL LLVDLKMPAR LSDSPRLRCL EADLTQPGVL 
ENVITANTSV VYHLAAIVSS HAEDDFDLGW KVNLDLTRQL LEACRRQPQK IRFVFSSSLA 
VYGGTLPECV TDTTALTPRS SYGAQKAACE LLVNDYTRKG YVDGLALRLP TICVRPGKPN 
RAASSFVSAI IREPLQGETT VCPVSESLRL WISSPATVIH NLSLAATLPA PGEASSINLP 
GISVTVGEML ETLRQAGGQA ARDRVTHQRD EGVEKIVASW PGRIDNQRAL ALGFVADKRF 
DDIIERFRQD DMEGRS