Gene Shel_23520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shel_23520
Symbol
ID	8396241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Slackia heliotrinireducens DSM 20476
Kingdom	Bacteria
Replicon accession	NC_013165
Strand	-
Start bp	2602450
End bp	2603778
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	62%
IMG OID	644987099
Product	collagenase-like protease
Protein accession	YP_003144710
Protein GI	257065038
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000439045
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGAAGA TGGAGCTCCT GGCGCCCGCG GGCGGTTGGG AACAGTTGGA ATACGCGGTT 
CATTTCGGGG CCGACGCCGT GTATCTGGCG TCGCAGCGCT ACGGCATGCG CCGTCGGGCG 
GACAACTTTA AAGAAGAGGA CCTGCCTCGG GCCATCGCTT TCGCACACGA CCACGGCGTT 
GCGGTCCATG TGACCGTGAA CACGCTCATG ACCGACGAGA ACATCGACGA TCTGCCTCGA 
TACTTCAAGC TGCTGGGAGA CGCCGGCGCC GATGCGGCCA TCATCGCGGA TATGGGAGCT 
TTGGCCATCT GCCGCGAGGT GGCGCCGCAT GTTGACATCC ATCTGTCCAC GCAGGCGTCC 
TGCATGAACG CCGCCTCGGC CCAGGTGTAC CAGAGCTTGG GCGTCAAGCG CGTCGTGCTG 
GCTCGCGAAA TGAACCTGGA CGAAATCGCA CGCATGAAGA GCCGTCTGCC CGAGGGGCTT 
GAAATCGAGG CCTTCGCCCA CGGTGCCATG TGCATGGCCT ATTCGGGTCG CTGCCTGATC 
AGCGATTACC TTACCGGCCG CGGCGCCAAC AAAGGCAGTT GCGCACAACC CTGCCGTTGG 
GAATACGCCC TGACCGAGCC GACGCGCCCG GGCGAGTACT TCCCGGTGGA AGAGGATGCC 
GAGCAGGGGA GCTTCATTAT GAGCTCCCGC GATATGAGCA TGCTGGGGCA TTTGGACGAC 
CTGGCGGCGG CGGGCATCGA CAGCATCAAG ATCGAGGGCC GCGCGAAAGG CACCTACTAC 
GTGGCTTCGG TGGTGAACGC CTACCGCAAT GTGCTGGACG GCGGCGACCC CGAGGTGTGG 
CAGCGTGAGC TGGAAACCAC CAGCCATCGC CCCTATTCCA CGGGGTTCTA TTACGGATTC 
CCAGGTCAGA ATCCGATTTC TGCACAATAC AGCCGCAAAT ACCAGATGGT TGCCACGGTT 
AAGTCCTGCG TGCCGGCCGA CGGAGGGTTC CAAGTGCGCG TCGTGTGCCG CAACCGGTTC 
GACGATGGCG ACACGGTGGA GGTCCTGAGT CCTCGGACGC CGGTTCGGGA ATGCACGGTG 
CGCAACCTGA TATGGCATGC CGCGCCGGAA ACCGACCTGA CGGACATCCT GCGGGACAAC 
CTGGGTACCG TCGTCGGCCC CGACCCGGAA GTGGTGCACG GGCGTCTGTT GCGCGTGGGT 
ATAGCCAACC GGACCATGGA GGAATACTCT TTCGATGTAC CGTTTGGATT GCAAGAACGT 
GACATTGTGC GCATCTCGCG TGATACGTCG GCGATTATTT GCGAAAATGG ACCATCTCCG 
TTTGCGTAA

Protein sequence

MAKMELLAPA GGWEQLEYAV HFGADAVYLA SQRYGMRRRA DNFKEEDLPR AIAFAHDHGV 
AVHVTVNTLM TDENIDDLPR YFKLLGDAGA DAAIIADMGA LAICREVAPH VDIHLSTQAS 
CMNAASAQVY QSLGVKRVVL AREMNLDEIA RMKSRLPEGL EIEAFAHGAM CMAYSGRCLI 
SDYLTGRGAN KGSCAQPCRW EYALTEPTRP GEYFPVEEDA EQGSFIMSSR DMSMLGHLDD 
LAAAGIDSIK IEGRAKGTYY VASVVNAYRN VLDGGDPEVW QRELETTSHR PYSTGFYYGF 
PGQNPISAQY SRKYQMVATV KSCVPADGGF QVRVVCRNRF DDGDTVEVLS PRTPVRECTV 
RNLIWHAAPE TDLTDILRDN LGTVVGPDPE VVHGRLLRVG IANRTMEEYS FDVPFGLQER 
DIVRISRDTS AIICENGPSP FA