Gene SeD_A0603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0603
Symbol
ID	6875860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	617064
End bp	618227
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	50%
IMG OID	642783821
Product	prophage DLP12 integrase
Protein accession	YP_002214507
Protein GI	198242564
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.591827
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.109932
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATCT TCCGTAGAGG TGAAATATGG TACGCCTCAT ACTCGCTCCC GGGCGGGAAG 
CGAATTAAGG AATCTCTTGG GACAGCGGAC AAGCGGCAAG CTCAGGAGTT GCACGACAAA 
AGAAAGGCTG AACTCTGGCG AGTAGACAAG CTCGGCGACT TTCCTGAAGT GACTTTTGAA 
GAAGCATGCC TCCGCTGGCT GGAAGAGAAA GCAGACAAGA AATCGCTCGA TACCGATAAA 
GGCCGGATGG GATTCTGGCT TGAGCATTTC GAAGGAGTAA GGATAAAGGA TATCACTGAG 
GCGAAGATTT ACGCCGCGGT GAGCAGGATG CAAAACAGGA AGGTAAAGGA GATATGGCAG 
CAGAAAGTTG AATCTGCCAA GAGAAAGGGT AAAGAAGCGC CAGTATTTGA GCCCAAGCCG 
GTCACCACAT CGACAAAGGC AAAGCACCTC GCACTGATAA AGGCCATTCT CCGGGCGGCA 
GAACGTGACT GGAAATGGCT GGAGAAAGCG CCTGTAATCA AGGTTCCTTC TGTCAGAAAC 
AAGCGCGTCA GATGGCTTGA GCGTGATGAG GCAAAAAGAC TTATTGAAGA ATGTCCGGAA 
CCGTTGAAAT CTGTTGTTAA ATTTGCGCTG GCAACGGGAC TTAGGCGGTC TAACATCATC 
AATATGGAGT GGCAACAGAT CGACATGCAG CGTCGTGTTG CCTGGGTGAA CCCTGAAGAC 
AGCAAGTCAA ACCGCGCTAT TGGCGTAGCG CTAAATGACA CTGCCTGTAA GGTATTGCGT 
GACCAGATTG GTAAGCATCA TAAATGGGTG TTCGTGCATA CGAAAGAAGG CATCCGGCCT 
GATGGTTCAA AGACGCCAAC CGTGAGAAAG ATGCGCGTCG ATGATCAGCG GGCGTGGAAT 
GCAGCTTGCC GCCGGGCCGG AATTGAGGAT TTTCGCTTCC ACGATCTGAG GCACACGTGG 
GCCAGCTGGC TGATTCAGTC CGGAGTTCCG CTTTCTGTTT TGCAGGAAAT GGGAGGATGG 
GAGAGCATCG AGATGGTTCG ACGATATGCT CACCTTGCGC CGAACCATTT AACGGAACAC 
GCGAAGCAAA TTGACTCGAT TTTCAGTGAT GATGTCCCAA ATATGTCCCA TATGGAAAAT 
AATGATGGAA TTAAAGAGGC GTAA

Protein sequence

MSIFRRGEIW YASYSLPGGK RIKESLGTAD KRQAQELHDK RKAELWRVDK LGDFPEVTFE 
EACLRWLEEK ADKKSLDTDK GRMGFWLEHF EGVRIKDITE AKIYAAVSRM QNRKVKEIWQ 
QKVESAKRKG KEAPVFEPKP VTTSTKAKHL ALIKAILRAA ERDWKWLEKA PVIKVPSVRN 
KRVRWLERDE AKRLIEECPE PLKSVVKFAL ATGLRRSNII NMEWQQIDMQ RRVAWVNPED 
SKSNRAIGVA LNDTACKVLR DQIGKHHKWV FVHTKEGIRP DGSKTPTVRK MRVDDQRAWN 
AACRRAGIED FRFHDLRHTW ASWLIQSGVP LSVLQEMGGW ESIEMVRRYA HLAPNHLTEH 
AKQIDSIFSD DVPNMSHMEN NDGIKEA