Gene Msil_3687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3687
Symbol
ID	7093041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	4049605
End bp	4051674
Gene Length	2070 bp
Protein Length	689 aa
Translation table	11
GC content	64%
IMG OID	643466974
Product	Peptidyl-dipeptidase Dcp
Protein accession	YP_002363933
Protein GI	217979786
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.115326
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGA CGCACCCGGG CGAGGCGAAT CCGCTGCTCG AACCCTGGAC CGGGCCGTTC 
GAGGCGCCGC CCTTCGGACT GATCCGCTCC GATGAATTTC GTCCGGCCTT CAATCGCGCG 
CTCGCCGAGG CGCGGGCGGA GACCGACGCC GTCGCGGCCA ATCCCGAGCC GCCGACCTTC 
GCCAATACCA TCGAGGCGAT CGAGCGCAGC GGCAAGAATC TCGACAAGGT CGCAAGCGTC 
TTCTTCAATC TCGTCGGCAC GGATTCCGAT GAGACGCTGG AAGCGGTCGA GCGCGACATG 
GCGCCGATCC TGTCGCGTCA TCGCAGCGCG TTCTTTTTGA ATGAGGCGCT TTTCGCGCGG 
GTCGCCGCGC TCCATGCGCA GCGCGATTCT CTGGGGCTCG ACGCCGAGCA GGCGCGCGTG 
CTCGAACGCT ATCATCTGAA TTTCACGCGC AATGGCGCCG GCCTGCCCTC TGAGGCCAAG 
GCGCGCCTTG CCGATATCGG CGAGCGCCTC GCCAGCCTTG GCGCGCAATT CGGCCAGAAT 
GTTCTGGCCG ACGAAAAAGC CTATCTGCTG ATTCTCGACA TCGAGGATCT CGGCGGCCTG 
CCCGATTTCC TGGTTGCGAG CGCGGCCCGC ATCTCCGCCG AGCGCGGCCA TCCCGGCCGA 
TACGGGATCA CCCTGTCGCG CTCCAGCATC GAGCCGTTCC TGCAGTTCTC GAACCGGCGC 
GATCTGCGGG AAAGGGCGTT CCGCGCTTGG TCTGCGCGCG GCGAAAGCGA CGGCCATACG 
GATAATCGCC CGATCGCCGC CGAAATGGTC AAGCTCAGGG CCGAGCGCGC GGCGCTTCTT 
GGCTATGAAA GCTTCGCCCA TTTTCGCCTG GCCGACACCA TGGCCAAGAC GCCCGAGGCG 
GCGCTCGATC TTCTGCAATC GGTCTGGACG CCAGCGGTGC AGCGCGCCGC GGAGGAGGAG 
CAGGCGCTGC AAAAGCTCGC CGCCGCCGAG GGCGAGAATT TCCGCATCGC GCCCTGGGAC 
TGGCGCTATT ACGCGGAAAA GCAGCGCAAG GCCGAATTCG ACCTCGATGA GGGCGAGATC 
AAGCCTTATC TGCAGCTCGG CAAATTGATC GAGGCCGCCT TCTACGCCGC GGGCCGGCTG 
TTTGGGCTCA GTTTTACCGA ACGCTTCGAC ATTCCGCTCT ACAACAAGGG CGCGCGCGCC 
TTTGAAGTCG CGCGGGACGG CAAGCCGGTC GCGCTGTTCA TCGGCGATTA TCTGGCGCGG 
CCGTCCAAAC GCAGCGGCGC TTGGATGAGC GATTTTCGCG GCCAGCACAA ACTCGACGGC 
GCGCAATTGC CCATCATCGT CAATGTCATG AATTTTGCGC AGGGCGGCGA GGGCGAGCCA 
AGCCTGCTCA GCTTCGATGA CGCGCGCACG CTGTTCCATG AATTCGGCCA CGGTCTGCAT 
GGCATGCTGT CCGACGTGAC CTATCCGACG CTTTCGGGCA CCAATGTCGC GCGCGACTTC 
GTTGAATTTC CCTCGCAGCT CTATGAGCAT TGGCTGGAGC AGCCCGAGAT TTTGCGTCGC 
TTCGCGCTGC ATTATGAGAC GGGTGAGCCG ATGCCGGAGG CGCTCATCGA AAAGCTCGTC 
GCCGCGCGAA AATTCAATCA GGGCTTCGCG ACGCTCGAAT ATGCCGCCTC CGCGCTGGTC 
GACCTCAGCC TGCATCTGAA CGCGACGCCG GAGGATCTCG ACGTCGTCGC GCTCGAACAG 
AAGGAGCTGG CGCGCATCGG CATGCCGGAG GCCATCGCCA TGCGTCACCG CACGCCGCAT 
TTCCAGCACA TCTTTTCGGG CGAATCCTAT TCGGCCGGCT ACTACAGCTA TCTCTGGTCG 
GAAATTCTCG ACGCCGACGG TTTTGAGGCC TTCCACGAGA CCGGCGACAT CTTCCATACG 
GAGACGGCGC GGCGGCTGCA TGATTTCGTC TATGCCGCCG GCGGCAGCCG CGACTATGAG 
GACGCCTACG CAGGATTTCG CGGGCGGGCG CCCTCGCCAC AGGCGCTGCT GCGAAAGCGC 
GGCCTGGATA GTGCGGCGGC GGCGAGTTAG

Protein sequence

MTKTHPGEAN PLLEPWTGPF EAPPFGLIRS DEFRPAFNRA LAEARAETDA VAANPEPPTF 
ANTIEAIERS GKNLDKVASV FFNLVGTDSD ETLEAVERDM APILSRHRSA FFLNEALFAR 
VAALHAQRDS LGLDAEQARV LERYHLNFTR NGAGLPSEAK ARLADIGERL ASLGAQFGQN 
VLADEKAYLL ILDIEDLGGL PDFLVASAAR ISAERGHPGR YGITLSRSSI EPFLQFSNRR 
DLRERAFRAW SARGESDGHT DNRPIAAEMV KLRAERAALL GYESFAHFRL ADTMAKTPEA 
ALDLLQSVWT PAVQRAAEEE QALQKLAAAE GENFRIAPWD WRYYAEKQRK AEFDLDEGEI 
KPYLQLGKLI EAAFYAAGRL FGLSFTERFD IPLYNKGARA FEVARDGKPV ALFIGDYLAR 
PSKRSGAWMS DFRGQHKLDG AQLPIIVNVM NFAQGGEGEP SLLSFDDART LFHEFGHGLH 
GMLSDVTYPT LSGTNVARDF VEFPSQLYEH WLEQPEILRR FALHYETGEP MPEALIEKLV 
AARKFNQGFA TLEYAASALV DLSLHLNATP EDLDVVALEQ KELARIGMPE AIAMRHRTPH 
FQHIFSGESY SAGYYSYLWS EILDADGFEA FHETGDIFHT ETARRLHDFV YAAGGSRDYE 
DAYAGFRGRA PSPQALLRKR GLDSAAAAS