Gene SeHA_C4572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4572
Symbol	malK
ID	6491972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4446831
End bp	4447940
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	58%
IMG OID	642744644
Product	maltose/maltodextrin transporter ATP-binding protein
Protein accession	YP_002048221
Protein GI	194449504
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.535764
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG TACAGCTACG AAATGTAACG AAAGCCTGGG GTGACGTGGT GGTATCGAAA 
GATATTAACC TCGATATCCA TGACGGGGAG TTCGTGGTGT TTGTGGGACC GTCAGGCTGT 
GGTAAATCGA CCTTGCTGCG TATGATCGCC GGGCTTGAAA CCATCACCAG TGGCGACCTG 
TTTATCGGGG AAACCCGTAT GAATGATATT CCGCCTGCCG AGCGCGGCGT GGGCATGGTA 
TTCCAGTCTT ATGCGCTCTA TCCCCATCTC TCCGTTGCAG AAAACATGTC TTTCGGCCTC 
AAGCTGGCGG GCGCCAAAAA AGAGGTAATG AATCAACGCG TCAATCAGGT GGCGGAAGTG 
CTGCAACTGG CGCATCTGCT GGAACGTAAG CCAAAAGCGC TTTCCGGCGG GCAGCGTCAG 
CGCGTAGCGA TTGGCCGCAC GCTGGTGGCG GAGCCGCGTG TGTTTTTGCT GGATGAACCG 
CTCTCTAACC TGGACGCCGC GCTGCGCGTG CAGATGCGCA TTGAAATTTC TCGCCTGCAT 
AAACGTCTGG GCCGCACGAT GATTTACGTC ACCCACGATC AGGTCGAGGC GATGACGCTG 
GCCGACAAAA TCGTGGTGCT GGACGCCGGT CGCGTCGCTC AGGTCGGTAA GCCGCTGGAG 
CTGTACCACT ATCCGGCGGA CCGCTTTGTC GCGGGCTTCA TCGGCTCGCC GAAGATGAAC 
TTCCTGCCGG TGAAAGTGAC CGCCACCGCG ATTGAACAAG TCCAGGTCGA ACTGCCGAAT 
CGCCAGCAAA TCTGGCTGCC GGTCGAAAGT CGCGGCGTGC AGGTCGGCGC CAATATGTCT 
TTAGGCATTC GGCCGGAACA CCTGCTGCCG AGCGATATCG CCGATGTCAC CCTGGAAGGC 
GAAGTCCAGG TGGTCGAGCA GTTAGGGCAC GAAACACAAA TTCATATCCA GATCCCCGCC 
ATCCGTCAAA ACCTGGTTTA TCGCCAGAAT GACGTGGTGT TGGTAGAAGA GGGCGCCACA 
TTCGCTATCG GCCTGCCGCC AGAGCGCTGT CATCTGTTCC GCGAGGATGG CAGCGCATGT 
CGTCGTCTGC ATCAAGAGCC GGGTGTTTAA

Protein sequence

MASVQLRNVT KAWGDVVVSK DINLDIHDGE FVVFVGPSGC GKSTLLRMIA GLETITSGDL 
FIGETRMNDI PPAERGVGMV FQSYALYPHL SVAENMSFGL KLAGAKKEVM NQRVNQVAEV 
LQLAHLLERK PKALSGGQRQ RVAIGRTLVA EPRVFLLDEP LSNLDAALRV QMRIEISRLH 
KRLGRTMIYV THDQVEAMTL ADKIVVLDAG RVAQVGKPLE LYHYPADRFV AGFIGSPKMN 
FLPVKVTATA IEQVQVELPN RQQIWLPVES RGVQVGANMS LGIRPEHLLP SDIADVTLEG 
EVQVVEQLGH ETQIHIQIPA IRQNLVYRQN DVVLVEEGAT FAIGLPPERC HLFREDGSAC 
RRLHQEPGV