Gene SeHA_C3666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3666
Symbol	tldD
ID	6488692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3548762
End bp	3550207
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	57%
IMG OID	642743784
Product	protease TldD
Protein accession	YP_002047396
Protein GI	194450951
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTGA ACCTGGTAAG TGAACAATTG CTAGCGGCGA ATGGCCTGAA CCATCAGGAT 
CTGTTCGCTA TTTTGGGCCA ACTGGCCGAA CGCCGTCTTG ATTATGGCGA CCTCTATTTT 
CAGTCGAGCT ATCACGAATC CTGGGTTTTA GAAGACCGCA TCATTAAAGA TGGTTCATAT 
AATATCGACC AGGGCGTTGG CGTTCGCGCC ATTAGCGGCG AAAAAACCGG TTTTGCTTAT 
GCTGACCAGA TAAGCCTCCT GGCGCTGGAG CAGAGTGCGC AGGCAGCGCG AACCATTGTA 
CGCGATAACG GCGAAGGCAA GGTAAAAACG CTCGCCGCCG TAGCGCATCA GCCGCTCTAC 
ACCACCCTTG ATCCACTGCA AAGTATGAGC CGCGAAGAGA AGCTGGATAT CCTCAGACGC 
GTTGACAAAG TGGCGCGAGA AGCCGATAAA CGCGTGCAGG AAGTTAACGC CAGCCTGACC 
GGCGTATATG AATTAATCCT CGTGGCGGCG ACCGACGGGA CGCTGGCGGC GGATGTCCGT 
CCACTGGTGC GGTTGTCCGT TAGCGTGCAG GTGGAAGAAG ACGGTAAACG CGAGCGCGGC 
GCCAGCGGCG GCGGCGGTCG CTTTGGTTAT GAGTATTTTC TTGCCGATCT CGACGGCGAG 
GTTCGCGCCG ACGCGTGGGC GAAAGAAGCG GTACGCATGG CGCTGGTTAA TCTCTCCGCG 
GTCGCTGCGC CAGCGGGGAC GTTACCGGTG GTTCTGGGCG CCGGGTGGCC GGGCGTATTG 
CTGCACGAAG CGGTCGGGCA CGGGCTGGAA GGTGATTTTA ACCGTCGTGG GACGTCTGTG 
TTTAGCGGTC AGATCGGCGA GCAGGTTGCC TCCGCGCTTT GCACCGTAGT GGATGACGGC 
ACAATGATGA ACCGTCGTGG CTCCGTTGCT ATCGATGATG AAGGTACGCC AGGCCAGTAC 
AACGTATTGA TTGAAAATGG CGTACTGAAA GGATACATGC AGGACAAGCT GAACGCGCGC 
CTGATGGGCG CTGCGCCGAC CGGTAACGGG CGTCGCGAAT CTTATGCGCA TCTGCCGATG 
CCGCGTATGA CGAATACCTA TATGTTGGCG GGGCAGTCAA CGCCGCAGGA AATTATCGAA 
TCCGTTGAGT ACGGCATCTA TGCGCCTAAC TTTGGCGGCG GTCAGGTGGA TATCACCTCC 
GGCAAGTTTG TGTTCTCTAC CTCGGAAGCG TATCTGATTG AAAACGGCAA AGTCACGACG 
CCGGTGAAGG GCGCGACGTT AATTGGATCA GGCATTGAAA CGATGCAACA GATCTCCATG 
GTCGGCAATG ACCTTAAGCT GGATAACGGG GTGGGGGTTT GCGGTAAAGA GGGGCAAAGT 
CTGCCGGTAG GCGTAGGCCA GCCGACGCTG AAAGTCGATA ACCTGACGGT TGGCGGCACC 
GCATAA

Protein sequence

MSLNLVSEQL LAANGLNHQD LFAILGQLAE RRLDYGDLYF QSSYHESWVL EDRIIKDGSY 
NIDQGVGVRA ISGEKTGFAY ADQISLLALE QSAQAARTIV RDNGEGKVKT LAAVAHQPLY 
TTLDPLQSMS REEKLDILRR VDKVAREADK RVQEVNASLT GVYELILVAA TDGTLAADVR 
PLVRLSVSVQ VEEDGKRERG ASGGGGRFGY EYFLADLDGE VRADAWAKEA VRMALVNLSA 
VAAPAGTLPV VLGAGWPGVL LHEAVGHGLE GDFNRRGTSV FSGQIGEQVA SALCTVVDDG 
TMMNRRGSVA IDDEGTPGQY NVLIENGVLK GYMQDKLNAR LMGAAPTGNG RRESYAHLPM 
PRMTNTYMLA GQSTPQEIIE SVEYGIYAPN FGGGQVDITS GKFVFSTSEA YLIENGKVTT 
PVKGATLIGS GIETMQQISM VGNDLKLDNG VGVCGKEGQS LPVGVGQPTL KVDNLTVGGT 
A