Gene SNSL254_A1652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1652
Symbol
ID	6483639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1614779
End bp	1615870
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	48%
IMG OID	642737037
Product	choloylglycine hydrolase
Protein accession	YP_002040789
Protein GI	194443124
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3049] Penicillin V acylase and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.756503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAA AAAGTAAAGC AATGTTATTT ATCGCTCCGG CGCTGTTTTC ATACGCCCTG 
GCGGCACAGG CCTGCACGAC CCTTGCTATT CAGGATAAAC AAGGCGATAT TTTTCATGGG 
CGTACGCTGG AATATATGCA GGATTTACCC TCATGGTTAA CGTATTACCC GGCGGGAACA 
CAGTTTGATA AAAAAACGCC GGATGGCAGC CAGGGGATAA GCTATCAGGC GAAGTATCCG 
ATACTGGCCA TTACTTCCAC CATTACTGAT GGCGATAGCA GAGACATACT TGAAGGCATG 
AATAGCGCGG GATTGTCATT TAGTGAAAAC ATGATCATGA ATGCGCAGTT GCCGCCATTG 
CCCGCGAGTG AATATAAACA GGCAATTCCT GTCACCTCGT TGGGAGAATG GGCGCTGGCC 
CGTTTTGCTA CTGTCGGCGA GGTAAAACAG GCAATAAAAG AGGGCAAATT CTGGTCACCG 
GAACTGCATC GGTTTGGCGA TCTGAAATCG CCATTTCATT ACGCGTTTTA CGACAAGAAA 
GGAGGAAGCA TTGTCGTTGA AGTGGAAAAT GGTAAATTCC ATGTCTATGA CAATCCCACT 
CGCGTGATGA CAAATGGTCC CGCATTCCCC TGGCATCTGA CAAATCTGAA TAATTATACG 
CAATTAACCA ATGTGGACCG CTCTTCAGGC ACACTGGGCG GGATAAAAGT GATGCAGCCT 
GATAGCGGGA TTGCTATTGC AGACTTGCCA TCGTCCGATA CGTCGGTTTC CCGTTTTATA 
CGCGGCGTTT ATTACACCAC ATATGCGCCG CAAGCGACAT CCGCCCACGA TGCAATGAAT 
ACGCTTGCGC ATATTATGAG CCGTTTCGAT CGTCCGAAAA ATATTACGGT TGATTATATG 
GGGAGTGAAG GGGAAGGCAA CGCCACCCGC AAACCGGTCT CAGAATATAC GGTCTGGACA 
ACGCTGTCTG ACTTAACGCA CGGTGAGATG ATGGTGCGCG GCTACAATGA TATCAACTAT 
AAAACCTGGT CTCTTTCTCA GTTTAAGAAC GCGACAGCGC CCGTGTTCGA GAAAATCAAC 
GTCAAAGGAT AA

Protein sequence

MMKKSKAMLF IAPALFSYAL AAQACTTLAI QDKQGDIFHG RTLEYMQDLP SWLTYYPAGT 
QFDKKTPDGS QGISYQAKYP ILAITSTITD GDSRDILEGM NSAGLSFSEN MIMNAQLPPL 
PASEYKQAIP VTSLGEWALA RFATVGEVKQ AIKEGKFWSP ELHRFGDLKS PFHYAFYDKK 
GGSIVVEVEN GKFHVYDNPT RVMTNGPAFP WHLTNLNNYT QLTNVDRSSG TLGGIKVMQP 
DSGIAIADLP SSDTSVSRFI RGVYYTTYAP QATSAHDAMN TLAHIMSRFD RPKNITVDYM 
GSEGEGNATR KPVSEYTVWT TLSDLTHGEM MVRGYNDINY KTWSLSQFKN ATAPVFEKIN 
VKG