Gene SeD_A4053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4053
Symbol
ID	6875567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3895887
End bp	3896885
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	642787002
Product	2,3-diketo-L-gulonate reductase
Protein accession	YP_002217629
Protein GI	198244331
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.771616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	0.431121
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAA CTTTCGAAGA GTTAAAAGGG GCCTTCTACC GCGTCTTGCG GTCGCGGAAT 
ATTGCGGAAG ATACCGCCGA CGCCTGCGCG GAAATGTTCG CTCGCACCAC CGAGTCCGGT 
GTCTATTCCC ACGGCGTGAA CCGCTTTCCC CGCTTCATCC AGCAACTGGA TAACGGCGAC 
ATTATTCCTG ATGCTAAACC GCAGCGAGTT ACCAGCCTCG GCGCCATCGA ACAGTGGGAT 
GCTCAGCGCG CTATCGGCAA CCTGACGGCG AAAAAGATGA TGGACCGGGC CATCGAGCTG 
GCTTCCGATC ATGGTATTGG CCTGGTGGCG TTACGTAATG CTAACCACTG GATGCGCGGC 
GGCAGCTACG GCTGGCAGGC GGCGGAAAAA GGCTATATCG GCATTTGCTG GACCAACTCC 
ATCGCCGTCA TGCCGCCGTG GGGGGCGAAA GAGTGCCGTA TCGGTACCAA TCCGCTGATC 
GTCGCTATCC CTTCCACGCC GATCACGATG GTGGATATGT CGATGTCGAT GTTCTCCTAC 
GGAATGTTAG AAGTTAACCG TCTGGCGGGC CGCGAACTGC CGGTGGATGG CGGTTTCGAC 
GATAACGGTC AGTTGACCAA AGAACCGGGC GTTATCGAGA AAAATCGCCG CATTTTACCA 
ATGGGTTACT GGAAAGGATC TGGTCTGTCG ATTGTGCTGG ACATGATTGC CACCCTGCTT 
TCCAACGGCT CTTCCGTTGC CGAAGTGACC CAGGAAAACA GCGATGAGTA TGGCGTCTCA 
CAGATTTTCA TCGCCATAGA AGTGGATAAG CTGATCGATG GCGCAACCCG CGATGCCAAA 
CTGCAGCGGA TTATGGATTT CATCACCACT GCTGAACGCG CCGACGACAA CGTCGCGATT 
CGGCTGCCCG GCCACGAATT TACCAAATTG CTGGATGACA ACCGCCGTCA CGGTATCACC 
ATTGACGACA GCGTCTGGGC CAAAATTCAG GCGCTGTAA

Protein sequence

MKVTFEELKG AFYRVLRSRN IAEDTADACA EMFARTTESG VYSHGVNRFP RFIQQLDNGD 
IIPDAKPQRV TSLGAIEQWD AQRAIGNLTA KKMMDRAIEL ASDHGIGLVA LRNANHWMRG 
GSYGWQAAEK GYIGICWTNS IAVMPPWGAK ECRIGTNPLI VAIPSTPITM VDMSMSMFSY 
GMLEVNRLAG RELPVDGGFD DNGQLTKEPG VIEKNRRILP MGYWKGSGLS IVLDMIATLL 
SNGSSVAEVT QENSDEYGVS QIFIAIEVDK LIDGATRDAK LQRIMDFITT AERADDNVAI 
RLPGHEFTKL LDDNRRHGIT IDDSVWAKIQ AL