Gene SeSA_A4623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4623
Symbol
ID	6518172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	4497653
End bp	4499197
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	59%
IMG OID	642749564
Product	hypothetical protein
Protein accession	YP_002117297
Protein GI	194734619
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCATA ACATGAAGAA AAACCCTGTA AGTATACCAC ACTCCATTTG GCCCGCCGAT 
GACATCAAAC GGCTGGAACG CGATGCGGCG GATGCCTTCG GACTCACACT CTATGAATTG 
ATGCTGCGCG CTGGCGACGC GGCATTTCGG GTAGCCCGTG ACAGTTATCC TGACACCCGA 
CACTGGCTGG TGTTGTGTGG TCATGGCAAC AACGGCGGCG ATGGTTACGT CGTGGCGCGA 
CTAGCGCAAG CGGCGGGCAT TAGCGTAACG TTGCTGGCGC AGGAGAGCGA TAAACCGTTG 
CCTGAAGAAG CGGCGCAGGC GCGCGATGCC TGGCTGAATG CCGGCGGCAT TATCCATGCT 
GCCGATATTA TCTGGCCGGA AGCGACGGAT CTGATTATCG ACGCGCTGCT TGGCACCGGC 
ATAGCCCAGG CGCCGCGCGA CCCGGTAGCC GGTCTGATTG AACAGGCGAA CGCCCATCCT 
GCGCCGGTTG TCGCCGTCGA TATCCCGTCA GGCCTGCTGG CGCAAACGGG CGCCACGCCT 
GGCGCGGTGA TAAGCGCCGC GCATACGGTC ACGTTTATCG CCCTGAAACC AGGCCTGCTG 
ACCGGCAAAG CGCGTGACGT TACCGGCATA TTGCATTATG ACGCGTTGGG ACTGGAAGGC 
TGGCTGGCAA ACCAGACGCC GCCGCTCCGG CGTTTTGACG CGACGCAGTT GGGGCAATGG 
TTAACGCCGC GTCGACCGAC CTCGCATAAG GGCGATCATG GTCGTCTGGC GATTATCGGC 
GGCGACCAGG GAACAGCGGG CGCAATTCGG ATGGCTGGCG AGGCGGCGCT GCGTACGGGG 
GCTGGGTTGG TCAGAGTTCT GACTCGCGGT GAAAACATCG CGCCGTTGCT GACGGCCCGC 
CCGGAACTGA TGGTACATGA ACTCACGCCT CAGTCGCTGG AAGAGAGCCT GACCTGGGCT 
GACGTTGTGG TGATCGGCCC GGGGCTTGGG CAGCAGGAAT GGGGCAAAAA AGCCTTACAG 
AAAGTAGAAA ACGTCCGTAA ACCTATGCTG TGGGATGCGG ATGCGTTGAA CCTACTGGCA 
ATCAATCCTG ATAAACGTCA CAATCGCGTG ATTACGCCGC ATCCGGGAGA GGCTGCCCGC 
CTGTTAGGAT GTTCTGTGGC AGAAATTGAA AGTGATCGCT TACTTTCAGC GCAGCGTCTG 
GTAAAACGGT ATGGAGGCGT GGTCGTGTTA AAAGGCGCAG GAACGATTAT CGCCGCTGAA 
CACCACCCTC TGGCTATCAT TGACGCTGGT AATGCAGGGA TGGCGAGCGG CGGGATGGGC 
GATGTCCTGT CCGGCATCAT CGGCGCATTG CTCGGACAGA AGTTTACCCC GTATGATGCG 
GCATGTGTGG GATGTGTGGC TCACGGCGCG GCGGCGGACT TACTGGCAGC GCGTTATGGC 
GCTCGCGGCA TGTTGGCGAC CGATCTTTTT ACTACGCTGC GGCGTATTGT TAACCCTGAT 
GTGATTGACG TAAACCATGA TGAATCGAGT AATTCCGCTA CCTGA

Protein sequence

MDHNMKKNPV SIPHSIWPAD DIKRLERDAA DAFGLTLYEL MLRAGDAAFR VARDSYPDTR 
HWLVLCGHGN NGGDGYVVAR LAQAAGISVT LLAQESDKPL PEEAAQARDA WLNAGGIIHA 
ADIIWPEATD LIIDALLGTG IAQAPRDPVA GLIEQANAHP APVVAVDIPS GLLAQTGATP 
GAVISAAHTV TFIALKPGLL TGKARDVTGI LHYDALGLEG WLANQTPPLR RFDATQLGQW 
LTPRRPTSHK GDHGRLAIIG GDQGTAGAIR MAGEAALRTG AGLVRVLTRG ENIAPLLTAR 
PELMVHELTP QSLEESLTWA DVVVIGPGLG QQEWGKKALQ KVENVRKPML WDADALNLLA 
INPDKRHNRV ITPHPGEAAR LLGCSVAEIE SDRLLSAQRL VKRYGGVVVL KGAGTIIAAE 
HHPLAIIDAG NAGMASGGMG DVLSGIIGAL LGQKFTPYDA ACVGCVAHGA AADLLAARYG 
ARGMLATDLF TTLRRIVNPD VIDVNHDESS NSAT