Gene SNSL254_A3631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3631
Symbol	tldD
ID	6482241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3516391
End bp	3517836
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	57%
IMG OID	642738906
Product	protease TldD
Protein accession	YP_002042623
Protein GI	194445200
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.0205399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTGA ACCTGGTAAG TGAACAATTG CTAGCGGCGA ATGGCCTGAA CCATCAGGAT 
CTGTTCGCTA TTTTGGGCCA ACTGGCCGAA CGCCGTCTTG ATTATGGCGA CCTCTATTTT 
CAGTCGAGCT ATCACGAATC CTGGGTTTTA GAAGACCGCA TCATTAAAGA TGGTTCATAT 
AATATCGACC AGGGCGTTGG CGTTCGCGCC ATTAGCGGCG AAAAAACCGG TTTTGCTTAT 
GCTGACCAGA TAAGCCTCCT GGCGCTGGAG CAGAGTGCGC AGGCAGCGCG AACCATTGTA 
CGCGAGAACG GCGAAGGCAA GGTAAAAACG CTCGCCGCCG TAGCGCATCA GCCGCTCTAC 
ACCACCCTTG ATCCGCTGCA AAGTATGAGC CGCGAAGAGA AGCTGGATAT CCTCAGACGC 
GTTGACAAAG TGGCGCGAGA AGCCGATAAA CGCGTGCAGG AAGTTAACGC CAGCCTGACC 
GGCGTATATG AATTAATCCT CGTGGCGGCG ACCGACGGGA CGCTGGCGGC GGATGTCCGT 
CCACTGGTGC GGTTGTCCGT TAGCGTGCAG GTGGAAGAAG ACGGTAAACG CGAGCGCGGC 
GCCAGCGGCG GCGGCGGTCG CTTTGGTTAT GAGTATTTTC TTGCCGATCT CGACGGCGAG 
GTGCGCGCCG ACGCGTGGGC GAAAGAAGCG GTACGCATGG CGCTGGTTAA TCTCTCCGCG 
GTCGCTGCGC CAGCGGGGAC GTTACCGGTG GTTCTGGGCG CCGGGTGGCC GGGCGTATTG 
CTGCACGAAG CGGTCGGTCA CGGGCTGGAA GGTGATTTCA ACCGTCGTGG GACGTCTGTG 
TTTAGCGGTC AGATCGGTGA GCAGGTTGCC TCCGCGCTTT GCACCGTAGT GGATGACGGC 
ACAATGATGA ACCGTCGCGG CTCCGTTGCT ATCGATGATG AAGGTACGCC AGGCCAGTAC 
AACGTATTGA TTGAAAATGG CGTACTGAAA GGATACATGC AGGACAAGCT GAACGCGCGC 
CTGATGGGCG CTGCGCCGAC CGGTAACGGG CGTCGCGAAT CTTATGCGCA TCTGCCGATG 
CCGCGTATGA CGAATACCTA TATGTTGGCG GGGCAGTCAA CGCCGCAGGA AATTATCGAA 
TCCGTTGAGT ACGGCATCTA TGCGCCTAAC TTTGGCGGCG GTCAGGTGGA TATCACCTCC 
GGCAAGTTTG TGTTCTCTAC CTCGGAAGCG TATCTGATTG AAAACGGCAA AGTCACGACG 
CCGGTGAAGG GCGCGACGTT GATTGGATCA GGCATTGAAA CAATGCAACA GATCTCCATG 
GTCGGCAATG ACCTTAAGCT GGATAACGGG GTGGGGGTTT GCGGTAAAGA GGGGCAAAGT 
CTGCCGGTAG GCGTAGGCCA GCCGACGCTG AAAGTCGATA ACCTGACGGT TGGCGGCACC 
GCATAA

Protein sequence

MSLNLVSEQL LAANGLNHQD LFAILGQLAE RRLDYGDLYF QSSYHESWVL EDRIIKDGSY 
NIDQGVGVRA ISGEKTGFAY ADQISLLALE QSAQAARTIV RENGEGKVKT LAAVAHQPLY 
TTLDPLQSMS REEKLDILRR VDKVAREADK RVQEVNASLT GVYELILVAA TDGTLAADVR 
PLVRLSVSVQ VEEDGKRERG ASGGGGRFGY EYFLADLDGE VRADAWAKEA VRMALVNLSA 
VAAPAGTLPV VLGAGWPGVL LHEAVGHGLE GDFNRRGTSV FSGQIGEQVA SALCTVVDDG 
TMMNRRGSVA IDDEGTPGQY NVLIENGVLK GYMQDKLNAR LMGAAPTGNG RRESYAHLPM 
PRMTNTYMLA GQSTPQEIIE SVEYGIYAPN FGGGQVDITS GKFVFSTSEA YLIENGKVTT 
PVKGATLIGS GIETMQQISM VGNDLKLDNG VGVCGKEGQS LPVGVGQPTL KVDNLTVGGT 
A