Gene SeD_A2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2431
Symbol	rfbG
ID	6871427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2303918
End bp	2304997
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	44%
IMG OID	642785521
Product	CDP-glucose 4,6-dehydratase
Protein accession	YP_002216179
Protein GI	198242841
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02622] CDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.310419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0000678484
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGATA AAAATTTTTG GCAAGGTAAA CGTGTATTCG TTACCGGCCA TACTGGCTTT 
AAAGGAAGCT GGCTTTCGCT ATGGCTGACT GAAATGGGTG CAATTGTAAA AGGCTATGCA 
CTTGATGCGC CAACTGTTCC AAGTTTATTT GAGATAGTGC GTCTTAGTGA TCTTATGGCA 
TCTCATATTG GCGACATTCG TGATTTTGAA AAGCTGCGCA ATTCTATTGC AGAATTTAAG 
CCAGAAATTG TTTTCCATAT GGCAGCCCAG CCTTTAGTGC GCCTATCTTA TGAACAGCCA 
ATCGAAACAT ACTCAACAAA TGTTATGGGT ACTGTCCATT TGCTTGAAGC AGTTAAGCAA 
GTAGGTAACA TAAAGGCAGT CGTAAATATC ACCAGTGATA AGTGCTACGA CAATCGTGAG 
TGGGTGTGGG GCTATCGTGA GAACGAACCC ATGGGAGGGT ACGATCCATA CTCTAATAGT 
AAAGGTTGTG CAGAATTAGT CGCGTCTGCA TTCCGGAACT CATTCTTCAA TCCTGCAAAT 
TATGAGCAAC ATGGCGTTGG TTTGGCGTCT GTGAGGGCTG GTAATGTCAT AGGCGGAGGC 
GATTGGGCTA AAGACCGTTT AATTCCCGAT ATTCTGCGCT CATTTGAAAA TAACCAGCAG 
GTTATTATTC GAAACCCATA TTCTATCCGT CCCTGGCAGC ATGTACTGGA GCCTCTTTCT 
GGTTACATTG TGGTGGCGCA ACGCTTATAT ACAGAAGGTG CTAAGTTTTC TGAAGGATGG 
AATTTCGGCC CGCGTGATGA AGATGCGAAG ACGGTCGAAT TTATTGTTGA CAAGATGGTC 
ACGCTTTGGG GTGATGATGC AAGCTGGTTA CTGGATGGTG AGAATCATCC TCATGAGGCA 
CATTACCTGA AACTGGATTG CTCTAAAGCA AATATGCAAT TAGGATGGCA TCCGCGTTGG 
GGATTGACTG AAACACTTGG TCGCATCGTA AAATGGCATA AAGCATGGAT TCGCGGCGAA 
GATATGTTGA TTTGTTCAAA GCGTGAAATC AGCGACTATA TGTCTGCAAC TACTCGTTAA

Protein sequence

MIDKNFWQGK RVFVTGHTGF KGSWLSLWLT EMGAIVKGYA LDAPTVPSLF EIVRLSDLMA 
SHIGDIRDFE KLRNSIAEFK PEIVFHMAAQ PLVRLSYEQP IETYSTNVMG TVHLLEAVKQ 
VGNIKAVVNI TSDKCYDNRE WVWGYRENEP MGGYDPYSNS KGCAELVASA FRNSFFNPAN 
YEQHGVGLAS VRAGNVIGGG DWAKDRLIPD ILRSFENNQQ VIIRNPYSIR PWQHVLEPLS 
GYIVVAQRLY TEGAKFSEGW NFGPRDEDAK TVEFIVDKMV TLWGDDASWL LDGENHPHEA 
HYLKLDCSKA NMQLGWHPRW GLTETLGRIV KWHKAWIRGE DMLICSKREI SDYMSATTR