Gene SNSL254_A3134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3134
Symbol	truD
ID	6486423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3047468
End bp	3048517
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	54%
IMG OID	642738445
Product	tRNA pseudouridine synthase D
Protein accession	YP_002042169
Protein GI	194443285
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.0800342
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGT TTGACAATCT CACCTGGCTG CACGGAAAAC CACAAGGTAG CGGATTGCTG 
AAAGCGAATC CGGAAGATTT TGTGGTGGTC GAAGATTTAG GCTTTACGCC GGATGGTGAA 
GGCGAGCACA TTCTGCTGCG TATTTTGAAA AACGGTTGCA ATACCCGTTT TGTCGCTGAC 
GCGCTGGCGA AATTCCTGAA AATTCACGCT CGCGAAGTGA GCTTTGCCGG GCAAAAAGAT 
AAACACGCCG TTACCGAGCA GTGGCTGTGC GCGCGCGTGC CGGGGAAAGA GATGCCCGAT 
TTCAGCGCCT TTCAGCTGGA AGGTTGTAAA GTGCTGGAAT ACGCGCGTCA CAAGCGTAAG 
CTGCGTTTAG GCGCGCTGAA AGGCAATGCC TTTACTCTGG TGTTGCGTGA AATAAGCGAT 
CGCCGCGATG TCGAAACACG ATTGCAGGCG ATTCGCGATG GCGGCGTGCC GAACTATTTT 
GGTGCACAGC GATTCGGCAT TGGCGGCAGC AACTTGCAGG GCGCGCTGCA CTGGGCGCAA 
AGTAACGCGC CGGTGCGCGA TCGCAATAAA CGCAGTTTTT GGTTGTCGGC GGCACGTAGC 
GCGTTGTTTA ATCAAATTGT TCACCAGCGG CTGAAGAAAC CAGACTTTAA TCAAGTTGTT 
GACGGCGATG CGCTACAATT AGCGGGGCGT GGAAGCTGGT TCGTCGCGAC ATCTGAAGAA 
CTGCCTGAAT TGCAGCGCCG GGTAGACGAA AAAGAGCTGA TGATTACAGC GTCGTTGCCG 
GGCAGCGGAG AGTGGGGAAC ACAGCGTGCG GCGCTGGCGT TTGAGCAAGA TGCCATTGCC 
CAGGAAACGG TGTTGCAATC GCTGTTGCTG CGCGAAAAAG TAGAGGCGTC GCGCAGAGCG 
ATGCTGCTTT ATCCGCAACA ATTAAGCTGG AACTGGTGGG ATGACGTTAC CGTCGAGTTA 
CGTTTCTGGC TGCCCGCAGG CAGTTTTGCC ACCAGCGTAG TAAGGGAACT GATCAACACA 
ATGGGTGATT ATGCGCATAT TGCTGAGTAA

Protein sequence

MTEFDNLTWL HGKPQGSGLL KANPEDFVVV EDLGFTPDGE GEHILLRILK NGCNTRFVAD 
ALAKFLKIHA REVSFAGQKD KHAVTEQWLC ARVPGKEMPD FSAFQLEGCK VLEYARHKRK 
LRLGALKGNA FTLVLREISD RRDVETRLQA IRDGGVPNYF GAQRFGIGGS NLQGALHWAQ 
SNAPVRDRNK RSFWLSAARS ALFNQIVHQR LKKPDFNQVV DGDALQLAGR GSWFVATSEE 
LPELQRRVDE KELMITASLP GSGEWGTQRA ALAFEQDAIA QETVLQSLLL REKVEASRRA 
MLLYPQQLSW NWWDDVTVEL RFWLPAGSFA TSVVRELINT MGDYAHIAE