Gene SeD_A2404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2404
Symbol	sbcB
ID	6873617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2274706
End bp	2276136
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	54%
IMG OID	642785495
Product	exonuclease I
Protein accession	YP_002216153
Protein GI	198243454
COG category	[L] Replication, recombination and repair
COG ID	[COG2925] Exonuclease I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.191485
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGTTA AAAACGACAG CATACAGAGC ACATTCCTCT TCCACGATTA CGAAACCTTC 
GGTACGCATC CGGCCCTCGA CAGACCTGCG CAATTCGCCG CGCTCCGTAC GGATAACGAC 
TTCAACGTTA TTGGCGAGCC GGAGGTGTTT TATTGCAAAC CCGCCGATGA TTATCTACCG 
CAGCCCGGCG CGGTGCTGAT TACCGGCATC ACGCCGCAGG AAGCGCGTGA GAAAGGAGAA 
AACGAAGCCG CTTTCGCCAG ACGCATTCAT GCGCTGTTTA CCGTTCCTAA AACCTGCGTT 
GTGGGCTACA ACAATGTGCG CTTTGATGAT GAAGTCACGC GCAATATTTT TTATCGCAAC 
TTTTACGATC CCTATGCCTG GAGCTGGCAG CATGATAATT CACGTTGGGA TCTATTGGAT 
GTCATGCGCG CCTGTTATGC GCTGCGCCCG GAGGGAATTA ACTGGCCGGA AAACGACGAC 
GGCCTGCCCA GCTTTCGTCT GGAACATTTA ACCCAGGCGA ACGGGATCGA ACACAGCAAC 
GCGCATGATG CGATGGCGGA TGTCTACGCC ACTATTGCGA TGGCGCAACT GGTGAAAACA 
CGCCAGCCGC GACTGTTTGA TTATCTTTAT AGCCACCGCA GTAAACATAA ACTGGCGGCG 
CTGATTGACG TTCCGCAGAT GAAGCCGCTG GTGCATGTCT CCGGCATGTT TGGCGCGTGG 
CGCGGTAATA CAAGCTGGGT CGCGCCGCTG GCGTGGCATC CTGAAAACCG TAACGCGGTG 
ATCATGGTCG ATTTAGCAGG CGATATTTCT CCTCTTCTTG AGCTGGACAG CGACACCCTT 
CGCGAGCGGC TTTATACGGC CAAAGCCGAT CTTGGCGATC ACGTCGCAGT GCCGGTAAAG 
CTGGTGCATA TCAATAAATG TCCGGTACTG GCGCAGGCGA ATACCTTGCG CCCGGAGGAT 
GCCGACCGGC TGGGAATTAA CCGCCAGCAC TGCCTGGATA ACCTGAAAGT GTTGCGTGAA 
AACCCGCAGG TCCGCGACAA AGTGGTGGCG ATTTTTGCCG AAGCCGAACC TTTTGCCGCC 
TCGGATAACG TTGATGCCCA GCTCTATGAT GGTTTTTTCA GCGATGCCGA TCGCGCAGCC 
ATGAAAATCG TACTCGAAAC CGAGCCGCGT AACCTGCCCG CGCTGGATAT TACCTTTGTC 
GATAAGCGCA TTGAGAAGCT GCTGTTTAAT TACCGCGCAC GCAATTTTCC CGGTACGCTG 
GATGACGCAG AGCAGCAGCG CTGGCTAGAG CATCGCCGTC AGGTGCTGAC GCCGGAGTTT 
TTACAACAAT ATGCCAATGA ATTGCAGATG CTTTCTCAGC AGTATGCGGA AGATAAAACG 
AAGCTGGGGT TGCTGAAATC ACTGTGGCAG TACGCAACTG AGATTGTGTA A

Protein sequence

MTVKNDSIQS TFLFHDYETF GTHPALDRPA QFAALRTDND FNVIGEPEVF YCKPADDYLP 
QPGAVLITGI TPQEAREKGE NEAAFARRIH ALFTVPKTCV VGYNNVRFDD EVTRNIFYRN 
FYDPYAWSWQ HDNSRWDLLD VMRACYALRP EGINWPENDD GLPSFRLEHL TQANGIEHSN 
AHDAMADVYA TIAMAQLVKT RQPRLFDYLY SHRSKHKLAA LIDVPQMKPL VHVSGMFGAW 
RGNTSWVAPL AWHPENRNAV IMVDLAGDIS PLLELDSDTL RERLYTAKAD LGDHVAVPVK 
LVHINKCPVL AQANTLRPED ADRLGINRQH CLDNLKVLRE NPQVRDKVVA IFAEAEPFAA 
SDNVDAQLYD GFFSDADRAA MKIVLETEPR NLPALDITFV DKRIEKLLFN YRARNFPGTL 
DDAEQQRWLE HRRQVLTPEF LQQYANELQM LSQQYAEDKT KLGLLKSLWQ YATEIV