Gene Anae109_1785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1785
Symbol
ID	5376088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	2015911
End bp	2017779
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	71%
IMG OID	640843293
Product	peptidyl-dipeptidase A
Protein accession	YP_001378972
Protein GI	153004647
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.44307
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACACA TTCTCCTCGT CACAGCACTG CTGCTCTCCA CGGCCGCGGG GGGCGCCGCC 
GCCGAGCCCT CCGACCCCGA CGCCCGCGCG ACCGTCGTCG CTCCGGCGCC CTCCTCGAAG 
CCGCCCACCG CCGCGGAGGC GAAGGCGTTC GTCGACGGCG TCAACGCCGA GCTGAAGCGG 
CTCTGGATCC GCTCGTCCAC CGCCGACTGG ATCAAGGCCA CCTACATCAC CGACGACACC 
GAGCGGAACG CCGCCGCCCT CAACGAGGAC GTCATGGCGT ACCTCTCGCG CGCCATCGCC 
GAGTCGGTCC GCTTCGACGG CGTGAAGGCG GACGCCGACA CCGCGCGCAT GCTGCACCTG 
CTCAAGGTCG CCTCGTCGCT GCCCGCGCCG AGCGATGCGG CCCGCCGGCG GGAGCTCGCC 
GAGATCTCCG CGAAGCTCGA GGGGATCTAC GGCAAGGGCA AGTGGTGCGG GACGCCCGCG 
CCGGGCAGGG CGGCGCCGCG CTGCCGCGAC CTGCAGCAGC TCGAGGAGGT CCTCGCGAAG 
AGCCGCAGCT ACCCCGAGCT GCTCGACGCC TGGACCGGCT GGCACACCAT CTCGCGCGAG 
ATGCGCCCGC TGTACGAGCG GCTCGTCACC CTCGGCAACG AGGGGGCCAG GGAGATCGGC 
TTCAGCGATC TCGGCGACCT CTGGCGCGCC GACTACGACA TGGCGCCCGA GGCGTTCGAG 
GCCGACGTCG GCCGGCTGTG GGCGGAGGTG AAGCCGCTCT ACGACGAGCT CCACTGCTAC 
GTGCGCGGCC GGCTCCAGCA GGCCTACGGG AAGGCCAAGG TCCCCGACGG AAAGCCGATC 
CCGGCGCACC TGCTCGGCAA CATGTGGGCG CAGGACTGGT CGAACCTCTA CCCGCTCGTC 
GAGCCGTTCA AGGGCGTGGG GAGCCTCGAC GTGGACGCGG CCCTGAAGCG TCAGAAGTAC 
GACGCGGCGC GGATGGTGAA GCTCGGCGAG GCGTTCTTCA CCTCGCTCGG CCTCGAGCCG 
CTCCCGCCCA GCTTCTGGGA GCGCTCCCAG CTCGTGAAGC CGCGCGACCG GGAGGTGGTG 
TGCCACGCGA GCGCGTGGGA CGTCACCTTC GCCGCCGACC TGCGCATCAA GATGTGCATC 
CGGCCCATCG AGGAGGACCT CGTCACCATC CACCACGAGC TGGGCCACAA CTATTACCAG 
CGCGCCTACG TCCACCTGCC GCTGCTCTTC CAGGACAGCG CCAACGACGG CTTCCATGAG 
GCGCTCGGCG ACGCGATCGC GCTCTCCGTG ACGCCGGGAT ATCTGAAGCA GGTCGGGCTC 
GTCCCGGGCG TCCCGAAGGA CGACCGCGGC ACCATCAACT TCCAGATGAA GAAGGCGCTC 
GAGAAGATCG CCTTCCTCCC GTTCGGGCTC CTCATCGACC AGTGGCGCTG GGATGTGTTC 
AGCGGGAAGG TGCCGCCGGA CCGCTACAAC GCCGCGTGGT GGGAGCTCCG GCGGAAGTAC 
CAGGGCGTCG ACGCCCCGGT CGCGCGGAGC GAGGCCGACT TCGACCCGGG CGCCAAGTAC 
CACATCCCCT CGAACGTCCC GTACACCCGC TACTTCCTGG CGCACGTGTA CCAGTTCCAG 
TTCCACCAGG CGCTGTGCGA GGCGGCCGGC TGGAAGGGGC CGCTCCACCA GTGCTCGATC 
TACGGCTCCA AGGACGCCGG CAAGCGGCTC GTGGCGATGA TGGAGCTCGG CGCGTCGCGG 
CCGTGGCCGG AGGCGTACGC GGCCCTCGCC GGCGCGAAGC AGGCCGACGC GTCGGCGCTG 
CTCGCGTACT TCGCCCCTCT CCGCAAGTGG CTCGCGGAGC AGAACGCGGG CCGCACGTGC 
GGGTGGTGA

Protein sequence

MRHILLVTAL LLSTAAGGAA AEPSDPDARA TVVAPAPSSK PPTAAEAKAF VDGVNAELKR 
LWIRSSTADW IKATYITDDT ERNAAALNED VMAYLSRAIA ESVRFDGVKA DADTARMLHL 
LKVASSLPAP SDAARRRELA EISAKLEGIY GKGKWCGTPA PGRAAPRCRD LQQLEEVLAK 
SRSYPELLDA WTGWHTISRE MRPLYERLVT LGNEGAREIG FSDLGDLWRA DYDMAPEAFE 
ADVGRLWAEV KPLYDELHCY VRGRLQQAYG KAKVPDGKPI PAHLLGNMWA QDWSNLYPLV 
EPFKGVGSLD VDAALKRQKY DAARMVKLGE AFFTSLGLEP LPPSFWERSQ LVKPRDREVV 
CHASAWDVTF AADLRIKMCI RPIEEDLVTI HHELGHNYYQ RAYVHLPLLF QDSANDGFHE 
ALGDAIALSV TPGYLKQVGL VPGVPKDDRG TINFQMKKAL EKIAFLPFGL LIDQWRWDVF 
SGKVPPDRYN AAWWELRRKY QGVDAPVARS EADFDPGAKY HIPSNVPYTR YFLAHVYQFQ 
FHQALCEAAG WKGPLHQCSI YGSKDAGKRL VAMMELGASR PWPEAYAALA GAKQADASAL 
LAYFAPLRKW LAEQNAGRTC GW