Gene SeD_A1653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1653
Symbol
ID	6874976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1594995
End bp	1596608
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	49%
IMG OID	642784797
Product	periplasmic murein peptide-binding protein
Protein accession	YP_002215465
Protein GI	198243089
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.0552012
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCATT CTGTTTCAGT AACCTGTTGT GCGCTGTTGG TTAGCAGCTT TTCCCTGGCA 
TATGCTGCGG ATGTTCCCGG CGGAACGGTA CTGGCAGAAA AACAAGAACT GGTGCGTCAT 
ATCAAAGATG AGCCCGCTTC GTTAGATCCA GCGAAAGCCG TTGGGCTGCC TGAAATTCAG 
GTGATCCGCG ATCTGTTTGA AGGGCTGGTT AACCAGAACG AAAAGGGTGA AATTATCCCT 
GGCGTCGCCA GCCAGTGGAA GAGCAATGAT AATCGTATCT GGACGTTTAC GTTGCGGGAT 
AATGCGCAAT GGGCCGATGG AACGCCGGTG ACCGCCCAGG ATTTTGTCTA TAGCTGGCAA 
CGTCTCGTTG ATCCCAAAAC GCTTTCCCCC TTCGCCTGGT TTGCCGCGCT GGCTGGCATC 
ACTAATGCGC AAGCCATTAT CGACGGTAAA GTCACGCCGG ATCAGCTTGG CGTCAGTGCC 
GTGGACGCGC ACACTTTGCG TGTTCAGCTT GACAAGCCGT TGCCCTGGTT TGCCAGTCTG 
ACCGCCAGTT TTGCCTTTTA TCCGGTCCAA AAAGCGAATG TCGAAAGCGG CAAAGACTGG 
ATGAAGCCGG GAAAACTGAT TGGCAATGGC GCGTATGTGC TTAAAGAGCG CGTGGTAAAT 
GAAAAACTGG TGGTCGTGCC TAATACGCAT TACTGGGATA ACGCGAAAAC GGTACTGCAA 
AAAGTAACAT TTTTACCCAT TAACCAAGAA TCGGCTGCGA CGAAACGTTA CCTTGCCGGT 
GATATTGATA TCACCGAATC TTTCCCTAAA AATATGTACC AGAAATTATT GAAGGATATT 
CCAGGGCAAG TTTATACGCC GCCGCAATTA GGGACTTATT ATTATGCGTT TAATACGCAG 
AAAGGGCCGA CGGCGGATTC CCGCGTTCGT CTGGCGCTAA GTATGACCAT TGATCGCCGT 
TTGATGGCGG AAAAAGTCTT AGGTACCGGT GAAAAACCGG CCTGGCATTT TACACCGGAT 
GTCACGGCAG GATTTAAGCC CGATCCTTCA CCGTTTGAAC AAATGAGCCA GGAAGAACTT 
AACGCCCAGG CGAAAACATT GCTGCGTGCA GCAGGCTACG GATCGCAGAA GCCGCTTAAA 
TTAACTCTGC TTTACAATAC CTCAGAAAAC CATCAGAAAA TCGCGATTGC GGTGGCGTCA 
ATGTGGAAGA AAAATCTGGG GGTGGATGTG AAATTGCAAA ACCAGGAGTG GAAAACGTAT 
ATCGACAGCC GGAATACAGG TAATTTTGAT GTTATTCGCG CCTCCTGGGT GGGTGATTAC 
AACGAACCGT CGACTTTCTT ATCCTTATTA ACGTCCACGC ATACGGGGAA TATTTCACGC 
TTTACTAATC CGACTTATGA CAAAATCCTG ACGCAAGCGA CGATGGAAAA TACCGCCGAA 
GCGCGTAACG CGGATTACAA TGCAGCGGAG AAAATTTTAA CGGAACAAGC GCCTATAGCG 
CCTATTTATC AGTATACCAA TGGCCGGTTA ATTAAACCGT GGGTAAAGGG ATACCCCATT 
ACTAACCCGG AAGATGTGGC CTATAGCCGT ACAATGTATA TCGTGAAGCA CTGA

Protein sequence

MRHSVSVTCC ALLVSSFSLA YAADVPGGTV LAEKQELVRH IKDEPASLDP AKAVGLPEIQ 
VIRDLFEGLV NQNEKGEIIP GVASQWKSND NRIWTFTLRD NAQWADGTPV TAQDFVYSWQ 
RLVDPKTLSP FAWFAALAGI TNAQAIIDGK VTPDQLGVSA VDAHTLRVQL DKPLPWFASL 
TASFAFYPVQ KANVESGKDW MKPGKLIGNG AYVLKERVVN EKLVVVPNTH YWDNAKTVLQ 
KVTFLPINQE SAATKRYLAG DIDITESFPK NMYQKLLKDI PGQVYTPPQL GTYYYAFNTQ 
KGPTADSRVR LALSMTIDRR LMAEKVLGTG EKPAWHFTPD VTAGFKPDPS PFEQMSQEEL 
NAQAKTLLRA AGYGSQKPLK LTLLYNTSEN HQKIAIAVAS MWKKNLGVDV KLQNQEWKTY 
IDSRNTGNFD VIRASWVGDY NEPSTFLSLL TSTHTGNISR FTNPTYDKIL TQATMENTAE 
ARNADYNAAE KILTEQAPIA PIYQYTNGRL IKPWVKGYPI TNPEDVAYSR TMYIVKH