Gene SeSA_A3866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3866
Symbol
ID	6518946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	3733833
End bp	3734831
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	642748839
Product	2,3-diketo-L-gulonate reductase
Protein accession	YP_002116602
Protein GI	194738073
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAA CTTTCGAAGA GTTAAAAGGG GCCTTCTACC GCGTCTTGCG GTCGCGGAAT 
ATTGCGGAAG ATACCGCCGA CGCCTGCGCG GAAATGTTCG CTCGCACCAC CGAGTCCGGT 
GTCTATTCCC ACGGCGTGAA CCGCTTTCCC CGCTTCATTC AGCAACTAGA TAACGGCGAC 
ATTATTCCTG ATGCTAAACC GCAGCGGGTT ACCAGCCTCG GCGCCATCGA ACAGTGGGAT 
GCTCAGCGCG CTATCGGCAA CCTGACGGCG AAAAAGATGA TGGACCGGGC CATCGAGCTG 
GCTTCCGATC ATGGTATTGG CCTGGTGGCG TTACGTAATG CTAACCACTG GATGCGCGGC 
GGCAGCTACG GCTGGCAGGC GGCGGAAAAA GGCTATATCG GCATTTGCTG GACCAACTCC 
ATCGCCGTCA TGCCGCCGTG GGGCGCGAAA GAGTGCCGTA TCGGTACCAA TCCGTTGATC 
GTCGCCATCC CGTCTACGCC GATCACTATG GTAGATATGT CGATGTCGAT GTTCTCTTAC 
GGCATGCTGG AGGTTAACCG CCTGGCCGGC CGCGAACTGC CGGTGGACGG CGGTTTCGAC 
GATAACGGTC AGTTGACCAA AGAACCGGGC GTTATCGAGA AAAATCGCCG CATTTTACCG 
ATGGGTTACT GGAAAGGATC TGGTCTGTCG ATTGTGCTGG ACATGATTGC CACCCTGCTT 
TCCAACGGCT CTTCCGTTGC CGAAGTGACC CAGGAAAACA GCGATGAATA TGGCGTTTCG 
CAGATCTTCA TCGCCATAGA AGTGGATAAG CTGATCGATG GCGCAACCCG CGATGCCAAA 
CTGCAGCGGA TTATGGATTT CATCACCACC GCTGAACGTG CTGACGACAA CGTCGCGATT 
CGGCTGCCCG GCCACGAATT TACCAAATTG CTGGATGACA ACCGCCGTCA CGGTATCACC 
ATTGACGACA GCGTCTGGGC CAAAATTCAG GCGCTGTAA

Protein sequence

MKVTFEELKG AFYRVLRSRN IAEDTADACA EMFARTTESG VYSHGVNRFP RFIQQLDNGD 
IIPDAKPQRV TSLGAIEQWD AQRAIGNLTA KKMMDRAIEL ASDHGIGLVA LRNANHWMRG 
GSYGWQAAEK GYIGICWTNS IAVMPPWGAK ECRIGTNPLI VAIPSTPITM VDMSMSMFSY 
GMLEVNRLAG RELPVDGGFD DNGQLTKEPG VIEKNRRILP MGYWKGSGLS IVLDMIATLL 
SNGSSVAEVT QENSDEYGVS QIFIAIEVDK LIDGATRDAK LQRIMDFITT AERADDNVAI 
RLPGHEFTKL LDDNRRHGIT IDDSVWAKIQ AL