Gene SNSL254_A3885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3885
Symbol
ID	6486114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3763116
End bp	3764603
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	54%
IMG OID	642739149
Product	hypothetical protein
Protein accession	YP_002042860
Protein GI	194444038
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGGCA CAAAAATTCG ACTCTTAGCG GGCAGTCTGT TGATGTTGGC CTCTGCCGGC 
TATGTGCAGG CAGATGCGCT CCAGCCCGAT CCGGCATGGC AACAGGGGAC GCTGGCTAAT 
GGGTTACAGT GGCAAGTGTT GGCTACGCCT CAGCGCCCCA GCGATCGTAT TGAAGTTCGT 
CTCCAGGTTA ATACCGGTTC GCTCACCGAA AGTACGCAAC AGAGCGGGTT CAGCCATGCG 
ATTCCCCGTA TCGCGCTGAC GCAAAGCGGT GGTCTGGATG CCGCACAGGC ACGTTCTTTA 
TGGCAGCAAG GGTTTGATCC TAAACGTCCC ATGCCGCCCG TTATTGTTTC TTATGATTCC 
ACGCTCTATA ACCTCAGTTT ACCCAATAAC CGTAACGATC TGCTGAAAGA AGCGCTGACC 
TATCTGGCTA ACGTCTCCGG TAAATTAACC ATTACGCCAG AGACGGTGAA TCATGCGTTA 
AGCAGCGAAG ATATGGTTGC GACGTGGCCA GCAGATACTA AAGAGGGCTG GTGGCGTTAT 
CGGCTGAAAG GGTCGGCGTT ATTGGGGCAC GATCCCGCGG AACCGTTAAA GCAGCCGGTA 
GACGCAGCCA AAATTCAGGC TTTCTATGAA AAATGGTACA CCCCGGATGC CATGACGCTG 
ATTGTTGTCG GCAACATTGA TGCGCGCTCC GTCGCCGAGC AGATCAATAA AACGTTCGGT 
ACGCTGAAAG GTAAACGCGA AACGCCCGCC CCGGTGCCGA CGCTTTCGCC GCTGCGGGCG 
GAATCAGTGA GCATTATGAC CGATGCGGTG CGCCAGGATC GTCTCTCCAT TATGTGGGAT 
ACGCCGTGGC AACCGATTCG CGAGTCGGCA GCGCTGTTGC GCTACTGGCA GGCGGATCTG 
GCGCGCGAAG CGCTGTTCTG GCATATCCAG CAAGAGCTTA CTAAAAATAA CGCGAAAGAT 
ATTGGTCTGG GGTTTGACTG CCGGGTTCTG TTCCTGCGCG CGCAGTGCGC CATCAACATT 
GAATCACCTA ATGATAAGCT CAATACCAAT TTGAGCCTGG TGGCGAATGA ACTGGCGAAA 
GTACGCGATA AAGGTTTGTC GGAAGAGGAG TTTACTGCGC TGGTGGCGCA GAAAAATCTC 
GAATTGCAAA AGCTGTTCGC GACCTACGCG CGTACCGATA CTGACATTTT GACTGGACAG 
CGTATGCGCT CGCTGCAGAA TCAAGTGGTG GATATCGCGC CGGAGCAGTA TCAGAAGCTG 
CGCCAGAATT TCCTCAACAG CCTGACCGTC GATATGCTCA ATCAGAATCT ACGTCAGCAG 
CTATCGCAGG AGATGGCATT AATTTTGCTG CAACCGCAAG GCGAGCCGGA ATTTAATATG 
AAGGCGTTAA AGGCGACGTG GGATGAAATC ATGGTCCCGA CAACTGCCGC CGCTGTTGAA 
GCAGATGAGG CGCATCCGGA AGTGACGGAG ACACCGGCGG CACAGTAA

Protein sequence

MQGTKIRLLA GSLLMLASAG YVQADALQPD PAWQQGTLAN GLQWQVLATP QRPSDRIEVR 
LQVNTGSLTE STQQSGFSHA IPRIALTQSG GLDAAQARSL WQQGFDPKRP MPPVIVSYDS 
TLYNLSLPNN RNDLLKEALT YLANVSGKLT ITPETVNHAL SSEDMVATWP ADTKEGWWRY 
RLKGSALLGH DPAEPLKQPV DAAKIQAFYE KWYTPDAMTL IVVGNIDARS VAEQINKTFG 
TLKGKRETPA PVPTLSPLRA ESVSIMTDAV RQDRLSIMWD TPWQPIRESA ALLRYWQADL 
AREALFWHIQ QELTKNNAKD IGLGFDCRVL FLRAQCAINI ESPNDKLNTN LSLVANELAK 
VRDKGLSEEE FTALVAQKNL ELQKLFATYA RTDTDILTGQ RMRSLQNQVV DIAPEQYQKL 
RQNFLNSLTV DMLNQNLRQQ LSQEMALILL QPQGEPEFNM KALKATWDEI MVPTTAAAVE 
ADEAHPEVTE TPAAQ