Gene SeD_A1370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1370
Symbol
ID	6875455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1345511
End bp	1347562
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	51%
IMG OID	642784538
Product	protease 2
Protein accession	YP_002215208
Protein GI	198245473
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1770] Protease II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.364308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.00000000160982
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGCCAA AAGCCAATCG AATTCCCTAT GCCATGACCG TACATGGCGA TACGCGCATT 
GATAATTATT ACTGGCTGCG AGATGACACT CGCTCGCAGC CGGAAGTCCT TGATTACCTG 
CATCAGGAAA ATGAGTATGG CCGGAAGGTC ATGACCTCTC AGCAGGCGTT ACAGGACCGC 
ATTCTAAAAG AAATTATCGA TCGCATCCCG CCCAGAGAAG TTTCCGCTCC GTATGTGAAA 
AATGGCTATC GCTACCGTTA TATCTATGAA CCCGGCTGCG AATATGCCAT CTATCAACGA 
CAATCGGCGT TAAGCGAAGA GTGGGATGTG TGGGAAACCT TGCTCGATGC GAACCAGCGG 
GCCGCGCACA GCGAATTTTA TACGCTCGGC GGACTTGCCA TTACGCCGGA TAATACCATC 
ATGGCGCTGG CAGAAGATTA TTTATCCCGT CGTCAGTATG GGTTGCGTTT TCGTAACCTC 
GAAAGCGGTA ACTGGTATCC GGAACTGCTG GATAACGTTG CGCCTGAATT TGTCTGGGCC 
AATGATTCCC TGACCCTTTA CTATGTGCGT AAGCATAAGA AGACGCTGCT GCCCTATCAG 
GTTTGGCGGC ACACGATTGG CACTCCGTCA TCGCAAGATG AACTGGTATA TGAAGAGAAA 
GACGACACCT TTTATGTCAG CCTGCATAAA ACCACTTCGC AGCATTATGT GGTAATTCAT 
CTTGCCAGCG CCACCACTAG CGAAGTGCTA TTACTTGACG CGGAACTGGC CGATGCCGAG 
CCGTTTTCAT TCTTACCGCG CCGCAAAGAC CACGAATATA GTCTCGATCA CTATCAACAT 
AAGTTTTACC TGCGCTCTAA CCGGAACGGT AAAAACTTTG GGTTGTACCG TACCCGCGTG 
CGCAATGAAA ACGCCTGGGA AGAGCTGATC CCTCCGCGCG AGCATATTAT GCTGGAAGGG 
TTTACCCTGT TTACCGACTG GTTAGTGGTC GAAGAGCGTC AACGGGGGCT TACCAGCCTG 
CGGCAAATTA ACCGTAAAAC CCGTGAAGTG ATAGGCATTG CCTTTGACGA TCCGGCTTAC 
GTGACGTGGC TTGCCTATAA TCCCGAACCT GAGACCTCCC GGCTGCGTTA CGGCTATTCT 
TCAATGACGA CGCCAGATAC CTTGTTTGAA CTGGATATGG ATACCGGAGA ACGACGGGTA 
CTTAAACAGA CGGAAGTGCC TGGGTTTGAT TCTGGCTGTT ATCAGAGCGA ACACCTGTGG 
ATCACCGCGC GCGACGGCGT CGAAGTGCCG GTATCGCTGG TTTATCATCA GAAGTATTTT 
CGTAAAGGGC AAAATCCGCT TCTGGTTTAC GGCTACGGAT CTTACGGTTC CAGTATTGAC 
GCCGACTTCA GCAGCAGCCG ACTGAGCTTG CTGGATCGTG GCTTTGTTTA CGCAATCGTA 
CACGTTCGCG GCGGCGGTGA GCTGGGGCAG CAGTGGTATG AAGATGGCAA ATTCCTCAAA 
AAGCGGAATA CTTTTAATGA CTATCTTGAT GCCTGCGATG CCTTATTAAA ACTGGGTTAC 
GGTTCGCCGT CGCTGTGTTA CGGGATGGGC GGGAGCGCGG GCGGAATGCT AATGGGCGTC 
GCTATCAACG AACGCCCCGA GCTTTTCCAC GGCGTTATTG CCCAGGTACC CTTTGTTGAT 
GTATTAACCA CGATGCTGGA TGAGTCGATC CCACTAACGA CAGGAGAGTT TGAAGAGTGG 
GGGAACCCGC AGGATATTGA GTATTATGAC TATATGAAAA GCTATAGTCC TTATGACAAT 
GTCAAAGCGC AGGACTATCC GCACCTGCTG GTGACGACAG GATTGCACGA TTCCCAGGTG 
CAATACTGGG AACCTGCGAA GTGGGTGGCA AAATTACGCG AGCTAAAAAC GGACCAACGT 
CTGCTGCTGT TATGTACGGA TATGGACTCC GGGCACGGTG GTAAGTCGGG GCGGTTTAAA 
TCCTACGAAG GCGTCGCGCT GGAGTTCGCC TTTTTAATCG GCCTGGCGCA GGGAACCTTA 
CATAGCGCAT AG

Protein sequence

MLPKANRIPY AMTVHGDTRI DNYYWLRDDT RSQPEVLDYL HQENEYGRKV MTSQQALQDR 
ILKEIIDRIP PREVSAPYVK NGYRYRYIYE PGCEYAIYQR QSALSEEWDV WETLLDANQR 
AAHSEFYTLG GLAITPDNTI MALAEDYLSR RQYGLRFRNL ESGNWYPELL DNVAPEFVWA 
NDSLTLYYVR KHKKTLLPYQ VWRHTIGTPS SQDELVYEEK DDTFYVSLHK TTSQHYVVIH 
LASATTSEVL LLDAELADAE PFSFLPRRKD HEYSLDHYQH KFYLRSNRNG KNFGLYRTRV 
RNENAWEELI PPREHIMLEG FTLFTDWLVV EERQRGLTSL RQINRKTREV IGIAFDDPAY 
VTWLAYNPEP ETSRLRYGYS SMTTPDTLFE LDMDTGERRV LKQTEVPGFD SGCYQSEHLW 
ITARDGVEVP VSLVYHQKYF RKGQNPLLVY GYGSYGSSID ADFSSSRLSL LDRGFVYAIV 
HVRGGGELGQ QWYEDGKFLK KRNTFNDYLD ACDALLKLGY GSPSLCYGMG GSAGGMLMGV 
AINERPELFH GVIAQVPFVD VLTTMLDESI PLTTGEFEEW GNPQDIEYYD YMKSYSPYDN 
VKAQDYPHLL VTTGLHDSQV QYWEPAKWVA KLRELKTDQR LLLLCTDMDS GHGGKSGRFK 
SYEGVALEFA FLIGLAQGTL HSA