Gene SNSL254_A0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0037
Symbol
ID	6486426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	37096
End bp	38658
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	47%
IMG OID	642735481
Product	5'-Nucleotidase domain protein
Protein accession	YP_002039263
Protein GI	194444661
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.361552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	0.180073
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAA AGTTTTCGAT ATCCCTACTG TCGCTGTGCA TTGGTTTGTC TTCAGCCATT 
TCCTTTTCAG CCGATGCGCG TGACATCACA ATTTATTATA CAAACGATTT ACATGCCCAT 
GTAACCCCAG AAATTATCCC CTATGTATCC AAGACACGTC CGGTAGGCGG CTTTGCGCCC 
ATCTCGAAAA TTGTCAAAGA TGCAAAAGCG AAAGAGAAAG ATGTCTTTTT CTTTGATGCT 
GGCGACTATT TCACCGGACC TTTTATCAGT ACGCTGACCA AAGGCGAGGC TATTATTGAT 
ATTTTAAATA CCATGCCTTA CGACGCCGTC TCTGTCGGTA ACCATGAATT TGACCATGGC 
CATGAGAATC TGGTTAAACA ACTCAGCAAA TTGCAATTCC CGGTATTGTT GGATAATGTT 
TTTTACAGCG GCACAGATAC GCCATTAATT AAAGAACCGT ATACCATCGT GGAAAAAGAT 
GGATTCAAGA TCGGCGTCAT CGGTATGCAC GGCGTTTCCG CATTCTATGA AGCGATTGCC 
GCAGGCGTGC GTGAAGGCGT TGACTGCCGC GATCCGATTC CTTATGTGAA AAAACAGCTG 
GAAGAGTTAA AAGGGAAAGT TGACCTGACC GTGCTGCTCG CCCACGAAGG CGTACCGGGT 
ATGCAGTCCA GCGCAGGCGA GGCTGATGTC GCGCGCGCGC TGAAAACCGA CGTTGATATG 
GCGAAATCGC TGGAAGGCTA TGGACTTAAC GTCCTGATTA CCGGCCATGC GCATAAAGGT 
ACGCCAGAAC CGATTAAAGT GGGCGATACC CTTGTCGTTT CCACGGATGC GTACACCATC 
GAATTAGGTA AACTGGTGCT TGACTGGAAC CCGGAAACCA AAAAAGTGGA CAGCTACAAT 
GGTAAGTTGA TCACCATGTA TGCGGATACT TATAAGCCAG ATCCGGTCAC GCAGGCCAAA 
ATTGACGAAT GGGATAACAA GGTTAAGAAA ATTACCGATG AGGTGGTCGC GCACTCTCCG 
GAAGTGCTGA CCCGTTCTTA CGGTGAATCC GCGCCAACCG GCAACTTAAT CACCGATGCC 
CTGATGGCTA CCGTTCCTGG CGCCGACGCT TCCTTCTATA ATGCTGGCGG CATCCGTACC 
GAATTGCCTA AAGGTAATAT CACCTATGGT GATGTGCTGA GTATGTATCC GTTCACCAAC 
GATGTCATGA GCATGGAAAT CAGCGGTAAG GACCTGAAAT CCATCATGTC ACACGCTGCC 
GATCTGAAAA ACGGTATGCT GCACGTATCT AAAACCGTCC AGTTTAAATA TGACAGCACC 
AAACCGCTGG GCCAGCGTAT TGTTGAATTT GATATCAAAG GCAAACCGGT AGAAGACAAT 
AAACTCTATA CCGTCGCGCT GGACTCCTTT ATCGGTAAAG GTGGTGGCGG ATTTACCTTC 
ACTAAAGGTA AAAATATCAA ATATATAGGG ATACAAACCG CACCGGCGTT GGTTAACTAT 
ATGAAGCAGG TTAACAATAT TCAACCTGAC CACACCATGC GCGTGGATGA TATTAGCAAA 
TAA

Protein sequence

MNKKFSISLL SLCIGLSSAI SFSADARDIT IYYTNDLHAH VTPEIIPYVS KTRPVGGFAP 
ISKIVKDAKA KEKDVFFFDA GDYFTGPFIS TLTKGEAIID ILNTMPYDAV SVGNHEFDHG 
HENLVKQLSK LQFPVLLDNV FYSGTDTPLI KEPYTIVEKD GFKIGVIGMH GVSAFYEAIA 
AGVREGVDCR DPIPYVKKQL EELKGKVDLT VLLAHEGVPG MQSSAGEADV ARALKTDVDM 
AKSLEGYGLN VLITGHAHKG TPEPIKVGDT LVVSTDAYTI ELGKLVLDWN PETKKVDSYN 
GKLITMYADT YKPDPVTQAK IDEWDNKVKK ITDEVVAHSP EVLTRSYGES APTGNLITDA 
LMATVPGADA SFYNAGGIRT ELPKGNITYG DVLSMYPFTN DVMSMEISGK DLKSIMSHAA 
DLKNGMLHVS KTVQFKYDST KPLGQRIVEF DIKGKPVEDN KLYTVALDSF IGKGGGGFTF 
TKGKNIKYIG IQTAPALVNY MKQVNNIQPD HTMRVDDISK