Gene SeD_A1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1960
Symbol
ID	6874675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1891979
End bp	1893205
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	46%
IMG OID	642785080
Product	putative regulatory protein
Protein accession	YP_002215746
Protein GI	198245744
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID	[TIGR02152] ribokinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0000000520335
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTTAAAG AAGAAAGACG TCATGCCATC ATTAATTTAC TGATAAAGGA TAATAGTGTT 
AGCGTCAGTA AACTTTCAGA CCTTTATAAG GTTAGCCAGG AGACTATTCG TTCCGATCTA 
CGCTATTTCC AGAAATCAGG TATGCTTCAG CGTTGCTATG GCGGAGGGAT TTTAAACCGT 
GACGCGCTGA GTAAGCTTAT CACTGAAAAT AAGATTGATA TCTCCAGCAC TATCGCCACG 
CCAATCCATC AGGATGCAAA ACTGCGCCGG GAAAACCCAA AAAAAGCAGG CAAGGTGTGT 
GTTTTAGGCT CATTCAATAT TGATGTTTCA GCAACCGTGC CGTGGTTTCC ACAAAGCGGA 
GAATCCATTC TGGCCAGTCA ATTTGGATTC TATCCTGGCG GTAAAGGAGC CAACCAGGCT 
TTAGCGGCGA ACAATGCCGG CGCTGCGGCA CATTTTATTT TTAAAGTGGG CAAAGATCAG 
TTCAGCGCAT TTGCTATGAA TCATATTATT CAATCAGGTA TCGCCTCATA CAGCGCGTAT 
CAAACAGATA AAGCGCCCAC CGGTAGCGCA TTGATCTATG TCTCCGCCGT GGATGGCGAT 
AATATTATCG CCATCTACCC TGGCGCCAAT ATGATGCTCA CCACGCAAGA GATTAACGAG 
CAACACCGTT ATATCGCCGA GTCTGACGTT ATGTTAATGC AGCTCGAAAC GAACATTGAA 
GCGTTGACTG AATTTATTCG TCTGGGCAAA CAAGAAAATA AAATGATCAT GCTGAATCCT 
GCCCCCTATA CGAAACAGGT GACGCATTTA TTATCTGATA TTGACATCAT CACGCCGAAT 
GAAACTGAAG CCTCTTTTTT ATCCGGCGTA ACCATTACTG ATATTAATGA TGCGAAAAAA 
GCCGGAAATA TTATTCTGCA ATCCGGGGTG AAAAAAGTCA TCATTACCCT TGGCGCCCGT 
GGATCTCTGC TCTGTGAGCA CGCCCGCACG TTGTATATTC CTGCGTGGAG CGCCGTGGTA 
AAAGATGCCG CCGGGGCCGG TGACGCTTTT AATGGCGCCT TAGCCGCCGC GCTGGCGCGA 
CAAGCAGACA TGGTCGCAGC CATTCAATAT GCCTCCGCTT TCGCTTCTCT GGCGGTGGAA 
CAAGTCGGTG CGTCGAGTAT GCCTCAGCAC TTGCAGGTTT TACATCGAAT GCGTACCCAA 
TCTAATAAAG TCATTCACAT TAATTAA

Protein sequence

MFKEERRHAI INLLIKDNSV SVSKLSDLYK VSQETIRSDL RYFQKSGMLQ RCYGGGILNR 
DALSKLITEN KIDISSTIAT PIHQDAKLRR ENPKKAGKVC VLGSFNIDVS ATVPWFPQSG 
ESILASQFGF YPGGKGANQA LAANNAGAAA HFIFKVGKDQ FSAFAMNHII QSGIASYSAY 
QTDKAPTGSA LIYVSAVDGD NIIAIYPGAN MMLTTQEINE QHRYIAESDV MLMQLETNIE 
ALTEFIRLGK QENKMIMLNP APYTKQVTHL LSDIDIITPN ETEASFLSGV TITDINDAKK 
AGNIILQSGV KKVIITLGAR GSLLCEHART LYIPAWSAVV KDAAGAGDAF NGALAAALAR 
QADMVAAIQY ASAFASLAVE QVGASSMPQH LQVLHRMRTQ SNKVIHIN