Gene SeD_A3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3066
Symbol
ID	6871814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2955002
End bp	2956027
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	49%
IMG OID	642786095
Product	phage integrase
Protein accession	YP_002216741
Protein GI	198243118
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCA GAAAACAGCC TAACGGAAAA TGGTTGTGTG AATGCTACCC GAACGGACGG 
GATGGCAAAC GTGTACGCAA GCAATTTGCG ACTAAAGGCG AGGCCATAGC ATTCGAAAAC 
CACACCATGG ATGAGGTGAA CAAAAAACCG TGGCTGGGGG AGAAGGAAGA TCGGCGGCAT 
TTGTCAGAAG TGATTGATCA GTGGCATTTA CTTTATGGGC AGACGCTGGC AGACCCCAAA 
CGCCTGATGG CAAAACGCAG CATTATTTGT AATGGCTTGG GCGATCCCAT TGCCTCAGAG 
TTAACCGCAG GCGATTTTAC GAAATACAGG GAAGCACGGT TAAAAGGTGA AGTAAAAAAT 
GAAGATGGCG TGCTTATGTC GCCAGTTAAG CCCCGTACGG TAAACCTTGA ACAACGTAAC 
CTATCATCTG TTTTTGGCAC ACTGAAAAAG CTGGGCCACT GGTCAGCACC CAACCCGCTC 
GCTGGGCTAC CAACATTCAA AATCGCAGAG GGCGAACTGG CGTTCCTGGC ACCGGAAGAA 
ATTAAACGTC TACTGGATGC CTGTGCTGAT TCTCAGAGTC CCAGTTTGCT GATGATTGCA 
AAAGTATGCC TGGCAACTGG CGCCCGATGG AGTGAAGCTG AAAACCTGCA GGGCCATCAG 
CTATCAAAAT ACCGCATCAC TTATACCAAG ACGAAGGGCA AGAAAAACCG TACCGTGCCA 
ATATCTCAGG ATCTGTATGA AGAACTCCCC AAAAACAGAG GGAAGCTATT CACGCCATGC 
AGAAAAGCTT TTGAGCGTGC AGTAAAAAGA GCTGGTATTG AGCTACCAGA AGGCCAATGT 
ACCCACGTGC TGCGCCATAC CTTCGCCAGC CACTTTATGA TGAACGGCGG AAACATACTG 
GTACTGCGCG ATATTCTGGG CCACGCAGAT ATAAAAATGA CGATGGTTTA CGCTCACTTT 
GCCCCTGACC ACCTCGAAGA CGCAGTGACA AAAAACCCGC TTCACAACCT CAATTGGAAA 
CGCTAA

Protein sequence

MSIRKQPNGK WLCECYPNGR DGKRVRKQFA TKGEAIAFEN HTMDEVNKKP WLGEKEDRRH 
LSEVIDQWHL LYGQTLADPK RLMAKRSIIC NGLGDPIASE LTAGDFTKYR EARLKGEVKN 
EDGVLMSPVK PRTVNLEQRN LSSVFGTLKK LGHWSAPNPL AGLPTFKIAE GELAFLAPEE 
IKRLLDACAD SQSPSLLMIA KVCLATGARW SEAENLQGHQ LSKYRITYTK TKGKKNRTVP 
ISQDLYEELP KNRGKLFTPC RKAFERAVKR AGIELPEGQC THVLRHTFAS HFMMNGGNIL 
VLRDILGHAD IKMTMVYAHF APDHLEDAVT KNPLHNLNWK R