Gene SNSL254_A0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0439
Symbol
ID	6486808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	453780
End bp	454982
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	56%
IMG OID	642735862
Product	exonuclease subunit SbcD
Protein accession	YP_002039636
Protein GI	194444758
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.196846
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	104
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCC TCCACACCTC TGACTGGCAT CTGGGACAAA ACTTCTACAG TAAAAGCCGC 
GCCGCGGAGC ATCAGGCTTT TCTGGACTGG CTGCTGGAGA CCGCGCAGGC CCATCAGGTG 
GATGCCATTA TTGTCGCTGG CGATATTTTT GATACCGGTT CGCCGCCAAG CTATGCCCGA 
GAACTTTATA ACCGTTTCGT CGTTAATTTA CAGCAAACGG GTTGTCATCT GGTGGTGCTG 
GCCGGTAATC ATGATTCCGT CGCCACGCTA AACGAGTCGC GCGACATTCT GGCGTTTCTC 
AATACAACCG TGATCGCCAG CGCGGGCTAT GCGCCGCGGC TACTTCATCG TCGCGACGGT 
TCTCCGGGCG CCGTACTGTG CCCCATTCCC TTTTTGCGCC CGCGCGACAT TATTACCAGT 
CAGGCGGGGT TATCCGGCAG CGAGAAACAG CAGCAACTTC TTCATGCGAT TGCCGATTAT 
TATCAACAGC AGTATCAGGA AGCGTGCCAG CTACGCGGCG AACGAAAGCT GCCGGTTATC 
GCGACGGGAC ATTTAACCAC CGTCGGCGCC AGCAAAAGCG ATGCGGTTCG CGACATTTAT 
ATCGGTACGC TGGATGCCTT TCCGGCGCAG CATTTCCCCC CCGCAGATTA TATCGCATTA 
GGACACATTC ACCGCGCGCA ATGTGTCGGC GGCACGGAGC ATATCCGCTA TTGCGGCTCG 
CCCATCGCCC TCAGCTTTGA TGAGTGCGGC AAAAGCAAAT GCGTGCATCT GGTGACCTTC 
GACCAGGGGA AATGGCAAAG CACCGAAAGT CTGGCTGTCC CCGTGACTCA ACCGTTGGCG 
GTTTTAAAAG GCGACCTGGC ATCAATTACC GAACAGCTTG AGCAGTGGCG CGGCGTTGAG 
CAATCGCCCC CCGTCTGGCT GGATATTGAA ATCACAACCG ATGACTATCT GCACGATATC 
CAACGCAGAA TACAGACATT AACGGAGTCA CTCCCCGTAG AGGTATTACT GGTGCGCCGT 
AGCCGCGAAC AGCGCGAGCG CTCGCTGGCG AACGAGCGGC GGGAAACATT AAGCGAGCTT 
AGCGTGGAAG AGGTTTTTGC GCGGCGTCTG GCGCTGGAAG CGTTAGATAC CCCGCAGCGC 
GAGCGCCTGA ATCAGCTCTT TTCCAGCACG CTCTACGCGT TGAATGAGGA GCATGAGGCA 
TGA

Protein sequence

MRILHTSDWH LGQNFYSKSR AAEHQAFLDW LLETAQAHQV DAIIVAGDIF DTGSPPSYAR 
ELYNRFVVNL QQTGCHLVVL AGNHDSVATL NESRDILAFL NTTVIASAGY APRLLHRRDG 
SPGAVLCPIP FLRPRDIITS QAGLSGSEKQ QQLLHAIADY YQQQYQEACQ LRGERKLPVI 
ATGHLTTVGA SKSDAVRDIY IGTLDAFPAQ HFPPADYIAL GHIHRAQCVG GTEHIRYCGS 
PIALSFDECG KSKCVHLVTF DQGKWQSTES LAVPVTQPLA VLKGDLASIT EQLEQWRGVE 
QSPPVWLDIE ITTDDYLHDI QRRIQTLTES LPVEVLLVRR SREQRERSLA NERRETLSEL 
SVEEVFARRL ALEALDTPQR ERLNQLFSST LYALNEEHEA