Gene Dfer_3921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_3921
Symbol
ID	8227516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	+
Start bp	4767714
End bp	4769417
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	51%
IMG OID	644931762
Product	carboxyl-terminal protease
Protein accession	YP_003088290
Protein GI	255037669
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCAG AAAGACCTCA GCCCCCGATC CAGAACTCGA AATCCGTAGT TCGCTTGCCT 
ATTATCATCG CGATCACGCT GGCGGCGGGA GTGCTGCTGG GGAGCACGTT TTTCAGCGGA 
GGTAAAAAAC TGTCCGATGT TGCCAAAGGG TACAGCAAAT TCAGGGAAGT ATTAATGCTC 
GTCGAAAACA ACTATGTCGA TTCGGTCAAT ACCGAGGAAC TGGTGGATTT CTCGATCTCC 
AAAATGCTCG AAAAGCTTGA TCCGCATACG GCCTATTTCA ATTCCGAGGA AGCTACCGCG 
GCACGCTCGC AGCTCGAATC GGGATTTGAC GGCATCGGGG TCGAATTCAA TATTTACAAC 
GACACGGTTT ACGTGGTAAC GCCATTGAGC GGAGGTCCGT CGGAGGCTGC CGGTATCCAG 
AGTGGCGATC GCATTATTTC AGTGAATAAA GAAAACCTGT CGGGTCCGGG CGTTAGCAAT 
GCGCAGGTTT ACAAGCTCTT GCGTGGCAAA CGCGGAACAA AAGTGGACCT GGCCATTGAA 
AGGGTGGGCC TGAACGACAA AATGAATTTC TCGGTAGTTC GCGACCGTAT TCCCACTTAT 
TCGGTGGATG CGGCCTATAT GGTGGATCAG GAAATCGGTT ATATCAAGGT GAGCCGTTTT 
TCCGAAACCA CTTACGACGA GTTTAAATCG GCATTGAAAA CATTGAAAGC GGATGGTTTG 
AAAAACCTCA TTCTCGACCT CCGCGGCAAT CCGGGTGGTT ATATGGAACG CGCCACAAGC 
ATGGCCGACG AGTTTATTTC CGGCGATAAG CTGCTGGTTT ACACTGAAGG AAAAGACAGC 
CGGTTCGATC GCAAAACGCG TTCGCACGTG GCAGGCATGT TCGAGCAGGG CCCGCTGATC 
GTGCTCGTGG ACGAAGGCAG CGCCTCAGCT TCCGAAATCC TCGCGGGTGC ATTGCAGGAT 
CACGACCGCG CGCTGGTGGT GGGAAGAAGG TCTTATGGAA AAGGTTTGGT ACAAATGCCG 
ATCAAACTAT CGGACGGCTC GGAGCTGCGC CTTACCATCT CGCGCTACTT CACACCGAGC 
GGCCGCAGCA TCCAGAAACC TTACGAGCTC GGCAAGGGCG AAGATTACAG CCAGGACCTC 
ACGCACCGGT ACGAAAGCGG AGAGCTGTTT AACGTAGACA GCATTAAATT CGATAAAAGC 
AAGGTATACA AAACCGATGG CGGCCGTATC GTGTACGGCG GCGGAGGCAT TACACCGGAT 
ATTTTCGTGC CGAAAGACAC ATTGCTCAAC AGCAAATATC TTTTTGAATT GTATTCCAAA 
AACATCATCC GCGAATATGC ATTGCGGTAT GCCAATGAAA ACCAGAGAAA ACTGGAAAAA 
CTGCCGTTTA AAGAGTTCCT GAAAACGTTC GAAGTGAGCG ACGCCATGGT GGTCGAGCTG 
GTGAAAGACG CGTCCAAAGC GGGAATTAAA CCGAACGAGA AGGAACTGAA CCTTTCAAGA 
CCGCTCATTA CCTCGCAAAC GAAGGCGATC ATCGGTCGTT ACGTGTGGGG CAGAAAGCAG 
AAAAGCGGGC TGAATAACGA AGTGTTCCAG GTGCTGAACC CGACCGACAA TGTGTATCAG 
CACGCGGTAC AGCTTTTCAG CCAGGCGGCG CAGTTGGAAA AAGGCGAATT CAGCAGTCTT 
AATATTCCCA AAAACAAAAA GTAA

Protein sequence

MNSERPQPPI QNSKSVVRLP IIIAITLAAG VLLGSTFFSG GKKLSDVAKG YSKFREVLML 
VENNYVDSVN TEELVDFSIS KMLEKLDPHT AYFNSEEATA ARSQLESGFD GIGVEFNIYN 
DTVYVVTPLS GGPSEAAGIQ SGDRIISVNK ENLSGPGVSN AQVYKLLRGK RGTKVDLAIE 
RVGLNDKMNF SVVRDRIPTY SVDAAYMVDQ EIGYIKVSRF SETTYDEFKS ALKTLKADGL 
KNLILDLRGN PGGYMERATS MADEFISGDK LLVYTEGKDS RFDRKTRSHV AGMFEQGPLI 
VLVDEGSASA SEILAGALQD HDRALVVGRR SYGKGLVQMP IKLSDGSELR LTISRYFTPS 
GRSIQKPYEL GKGEDYSQDL THRYESGELF NVDSIKFDKS KVYKTDGGRI VYGGGGITPD 
IFVPKDTLLN SKYLFELYSK NIIREYALRY ANENQRKLEK LPFKEFLKTF EVSDAMVVEL 
VKDASKAGIK PNEKELNLSR PLITSQTKAI IGRYVWGRKQ KSGLNNEVFQ VLNPTDNVYQ 
HAVQLFSQAA QLEKGEFSSL NIPKNKK