Gene Coch_2116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Coch_2116
Symbol
ID	8368577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Capnocytophaga ochracea DSM 7271
Kingdom	Bacteria
Replicon accession	NC_013162
Strand	+
Start bp	2537227
End bp	2538477
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	42%
IMG OID	644984570
Product	peptidase U32
Protein accession	YP_003142221
Protein GI	256820942
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00231465
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCATT CAGGAAAAAT TGAACTAATG GCACCAGCTG GTAATTTTGA GTCGCTACAA 
GCGGCGATAG ACAATGGTGC CGACTCAGTG TACTTTGGGG TAGACCAGCT GAATATGCGC 
GCAAGGGCAA GTATCAACTT TACGATTGAC GACCTTGATG AAATAGCGCG CCGTTGTGCT 
CCTAAGGGCA TTCGCACTTA TCTCACCCTT AATACTATTA TTTATGACCA CGACCTATCT 
ATCATCAAAA CACTATTAGA CGCTGCCAAA AAAGCAGGTC TTACAGCTGT AATAGCTATG 
GATCAGGCAG TCATAGCTTA TGCTCGACAA ATAGGAATGG AGGTACATAT CTCTACCCAA 
ATCAATATCA CTAATATTGA AACCGTGCGC TTCTACGCGA TGTTTGCTGA TACAATGGTA 
ATGAGCCGTG AACTGAGCTT ACGACAAATC AAGAAGATAT GTGAGCAGAT AGAAAAAGAG 
CAAATCAAAG GACCTTCGGG CAATTTGGTA GAAATAGAAA TATTTGGACA CGGGGCACTT 
TGTATGGCGG TATCAGGCAA GTGCTACCTG AGTTTGCACT CACACAACTC ATCAGCCAAT 
CGCGGAGCTT GCAAGCAAAA CTGTCGCAAG AAATACACCG TAATCGACCA AGAAAGCGGT 
TTTGAGATAG AATTGGATAA CGAGTATATG ATGTCGCCTA AAGACCTCTG CACGATTGAC 
TTCCTAGACC AAGTAATCGA CACAGGGGCA AAGGTATTAA AGATTGAAGG ACGTGGGCGC 
GCTCCTGAGT ATGTGGCTAC CGTTATTCGC ACTTACCGAG AAGCAATAGA TGCTTATTAC 
GCAGGCACAT ACAGTAAAGA AAAATTTGAA AGCTGGATAG AAGCCCTCAA AACGGTGTAC 
AATCGTGGTT TCTGGAGTGG ATATTATTTA GGGCAAAAGC TCGGTGAATG GAGTGAAAAC 
CCAGGCTCTA ATGCTACCCA AAAGAAAGTG TACATTGGGC AAGGTAAACA CTATTTCCCT 
AAGACTGGTA TAGCTGAGTT TGCTATTGAA GCCTTTGATA TAAAGATAGG CGACAAATTA 
CTTATCACTG GACCTTCAAC AGGCGTTCAA GAAATAGAGC TGACCTCAAT GATGGTAAAC 
GATACTCCTG CTGAAAGAGC TAAGAAAGGT GATTCTTGTA CTATCAAAAC CAATTTCAGA 
ATAAGGTTAT CAGATAAACT GTATAAAATA GTAAAAACAA ATATCAATTA G

Protein sequence

MTHSGKIELM APAGNFESLQ AAIDNGADSV YFGVDQLNMR ARASINFTID DLDEIARRCA 
PKGIRTYLTL NTIIYDHDLS IIKTLLDAAK KAGLTAVIAM DQAVIAYARQ IGMEVHISTQ 
INITNIETVR FYAMFADTMV MSRELSLRQI KKICEQIEKE QIKGPSGNLV EIEIFGHGAL 
CMAVSGKCYL SLHSHNSSAN RGACKQNCRK KYTVIDQESG FEIELDNEYM MSPKDLCTID 
FLDQVIDTGA KVLKIEGRGR APEYVATVIR TYREAIDAYY AGTYSKEKFE SWIEALKTVY 
NRGFWSGYYL GQKLGEWSEN PGSNATQKKV YIGQGKHYFP KTGIAEFAIE AFDIKIGDKL 
LITGPSTGVQ EIELTSMMVN DTPAERAKKG DSCTIKTNFR IRLSDKLYKI VKTNIN