Gene SeD_A2481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2481
Symbol
ID	6871151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2361307
End bp	2362668
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	54%
IMG OID	642785564
Product	peptidase, U32 family
Protein accession	YP_002216222
Protein GI	198242901
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.433184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAC CAGAACTTCT TTCGCCGGCG GGAACGCTGA AAAATATGCG TTACGCTTTC 
GCTTACGGTG CCGATGCCGT CTATGCGGGC CAACCACGCT ACTCTTTACG CGTGCGTAAT 
AACGAATTCA ATCACGAAAA TTTGCAGCTT GGCATCAACG AAGCCCACGC GCTCGGAAAA 
AAATTCTACG TGGTGGTGAA CATCGCCCCG CATAACGCCA AGCTCAAAAC CTTTATCCGT 
GACCTGAAAC CCGTCGTCGA GATGGGCCCG GATGCGCTGA TCATGTCCGA TCCAGGGTTG 
ATTATGCTGG TACGCGAGCA CTTCCCGGCA ATGCCGATTC ACCTGTCGGT ACAGGCTAAC 
GCCGTAAACT GGGCGACGGT AAAATTCTGG CAGCAGATGG GGCTGACCCG CGTGATTCTC 
TCCCGCGAGC TGTCACTGGA AGAGATTGAG GAAATTCGCC AGCAGGTGCC GGATATGGAA 
ATAGAAATTT TCGTCCACGG CGCGCTATGC ATGGCCTATT CCGGTCGCTG CCTGCTTTCC 
GGCTACATCA ATAAACGCGA TCCGAATCAG GGCACCTGCA CCAATGCCTG CCGTTGGGAA 
TATAACGTGC AGGAAGGAAA AGAAGACGTT GTCGGCAACA TCGTGCATAA GCATGAACCG 
ATTCCGGTAC AGAACGTTGA GCCGACGCTC GGTATCGGCG CGCCGACGGA TAAAGTGTTT 
ATGATAGAAG AGGCCCAAAG ACCGGGCGAA TACATGACCG CGTTCGAAGA CGAGCATGGC 
ACCTATATCA TGAACTCAAA AGATTTGCGC GCTATCGCCC ACGTGGAGCG CCTGACGAAA 
ATGGGCGTCC ACTCGCTGAA AATCGAAGGC CGCACCAAAT CCTTTTATTA CTGCGCCCGT 
ACCGCGCAGG TCTACCGTAA GGCCATCGAC GACGCCGCCG CGGGTAAACC TTTCGACCCT 
ACGCTGCTGG AAACGCTGGA AGGTCTGGCT CATCGCGGCT ATACCGAAGG TTTCCTGCGT 
CGCCATACGC ACGACGATTA CCAGAATTAC GAGTACGGGT ACTCCGTTTC CGAACGCCAG 
CAATTTGTCG GCGAGTTCAC CGGTGAGCGT AAAGGCCAAC TGGCGGCCGT GGCGGTGAAG 
AATAAATTCT CCGTTGGCGA TAGTCTGGAG CTGATGACAC CGCAGGGAAA TATCAATTTC 
ACCCTGGAAC AGATGGAGAA CGCCAAAGGA GACGCTATGC CGGTGGCACC CGGCGATGGC 
TATACCGTCT GGATGCCCGT CCCGCAGGAC GTTACGCTGG ATTACGCACT ATTGATGCGT 
AATTTCTCAG GCGAATCAAC GCGTAACCCC CATGGTAAGT AG

Protein sequence

MFKPELLSPA GTLKNMRYAF AYGADAVYAG QPRYSLRVRN NEFNHENLQL GINEAHALGK 
KFYVVVNIAP HNAKLKTFIR DLKPVVEMGP DALIMSDPGL IMLVREHFPA MPIHLSVQAN 
AVNWATVKFW QQMGLTRVIL SRELSLEEIE EIRQQVPDME IEIFVHGALC MAYSGRCLLS 
GYINKRDPNQ GTCTNACRWE YNVQEGKEDV VGNIVHKHEP IPVQNVEPTL GIGAPTDKVF 
MIEEAQRPGE YMTAFEDEHG TYIMNSKDLR AIAHVERLTK MGVHSLKIEG RTKSFYYCAR 
TAQVYRKAID DAAAGKPFDP TLLETLEGLA HRGYTEGFLR RHTHDDYQNY EYGYSVSERQ 
QFVGEFTGER KGQLAAVAVK NKFSVGDSLE LMTPQGNINF TLEQMENAKG DAMPVAPGDG 
YTVWMPVPQD VTLDYALLMR NFSGESTRNP HGK