Gene SeHA_C3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3947
Symbol	dppD
ID	6487844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3824446
End bp	3825429
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	56%
IMG OID	642744051
Product	dipeptide transporter ATP-binding subunit
Protein accession	YP_002047657
Protein GI	194447373
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.301836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTAT TAAATGTAGA TCAATTATCG GTGCACTTCG GCGACGAAGG GACACCGTTC 
AAAGCCGTCG ACCGTATTAG CTACAGCGTG AAGCAGGGTG AGGTGGTCGG GATTGTCGGC 
GAGTCTGGTT CCGGCAAATC CGTCAGCTCG CTGGCGATTA TGGGGCTTAT CGATTACCCA 
GGCCGCGTGA TGGCGGAAAA CCTGCTCTTT AACGGACAGG ATCTGAAGCG CATTTCCGAG 
AAGGAACGTC GCAACCTGGT GGGCGCTGAA GTGGCGATGA TTTTCCAGGA CCCGATGACC 
AGCCTCAATC CTTGCTATAC CGTTGGCTTT CAGATTATGG AAGCCATCAA GGTACATCAG 
GGCGGGAACA AGAAAACCCG TCGTCAGCGA GCGATTGACC TGTTGAACCA GGTGGGCATT 
CCCGATCCGG CTTCTCGTCT GGATGTCTAT CCGCACCAGC TTTCTGGCGG CATGAGTCAG 
CGTGTGATGA TTGCGATGGC AATAGCCTGT CGACCAAAGC TGTTAATTGC TGATGAACCG 
ACCACGGCGC TGGATGTGAC CATTCAGGCG CAAATCATTG AGCTGCTGCT GGAGTTGCAG 
CAAAAAGAGA ACATGGCGCT GGTGCTGATT ACCCATGACC TGGCGCTGGT GGCGGAAGCG 
GCGCACAAAA TTATCGTCAT GTACGCCGGG CAGGTCGTCG AAACTGGCGC TGCGCAGGAT 
ATTTTCCGCG CGCCGCGTCA TCCCTACACC CAGGCACTGC TACGCGCGTT ACCAGAGTTT 
GCTCAGGACA AAGCGCGTCT GGCGTCGCTG CCGGGCGTGG TGCCGGGGAA ATATGACCGA 
CCGACGGGCT GTCTGCTTAA CCCGCGCTGC CCCTACGCCA CGGACAGATG TCGTGCGGAA 
GAACCTGCTC TCAACCAACT GGACGATGGA CGTCAGTCAA AATGTCATTA CCCACTCGAT 
GATGCCGGGA GGCCCACACT ATGA

Protein sequence

MALLNVDQLS VHFGDEGTPF KAVDRISYSV KQGEVVGIVG ESGSGKSVSS LAIMGLIDYP 
GRVMAENLLF NGQDLKRISE KERRNLVGAE VAMIFQDPMT SLNPCYTVGF QIMEAIKVHQ 
GGNKKTRRQR AIDLLNQVGI PDPASRLDVY PHQLSGGMSQ RVMIAMAIAC RPKLLIADEP 
TTALDVTIQA QIIELLLELQ QKENMALVLI THDLALVAEA AHKIIVMYAG QVVETGAAQD 
IFRAPRHPYT QALLRALPEF AQDKARLASL PGVVPGKYDR PTGCLLNPRC PYATDRCRAE 
EPALNQLDDG RQSKCHYPLD DAGRPTL