Gene Acid345_1597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1597
Symbol
ID	4068898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1942660
End bp	1943973
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	58%
IMG OID	637983606
Product	peptidase M20D, amidohydrolase
Protein accession	YP_590673
Protein GI	94968625
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCTT TCTGGGCCGT CGTCCTGTTA TGTCTTTCTT CCGTCCCGTT TTTTGGGGCC 
AATCCTCCTG CAGATTTAAA AGCGAAAGTC GACCAGTTGC TACCACAGCT GCGCGCTTTC 
TACATTGACC TTCATCAATC CCCGGAGCTT TCTCTTCACG AGGAAAATAC GGCAGCCAAG 
CTGGCTGCGG GACTCCGCAA GCTTGGCTTT GAAGTCACGG AACATGTGGG TGGAACTGGC 
GTAGTCGGCG TGCTCAAGAA TGGCGACGGC CCGGTCGTGC TGATCCGGAC GGAGCTCGAT 
GCATTGCCCG TGGAAGAACA GACGGGACTT CCCTACGCCA GCAAAGTGAA GACGAAGAAC 
GCCAGCGGGC AGGAAGTGTC GGTGATGCAT GCTTGCGGAC ACGATCTTCA CATGGCAAGT 
TGGCTCGGAA CAGCGACACT GCTGAGCCAG AACAAATCGC TGTGGCACGG CACGCTGCTG 
ATGATCGGAC AGCCGGCCGA AGAGATTGGC GCGGGTGCCG ACGCAATGAT CAAGGATGGG 
TTGCTTACGC GTTTTCCCAA GCCCGATTAC TCCATCGCCG TACACGATGA CTCCGCGATG 
CCGGCAGGTC AGGTCGATGT CACCGGCGGC CCGGTATTTG CCGCTGCTGC CTCGGTGAAG 
ATCACGATCT ACGGCAGAGG CGGGCATGGC GCTCAGCCGC AAACTACGGT GGATCCGATT 
GTTATTGCCG CGAGAACCAT CCTTAGCTTG CAGACGATCG TCTCCCGCGA ACTCAGTCCG 
CTGGATCCGG CGGTGGTGAC GGTTGGTGCG ATCCACGGTG GCACCAAAAA CAACATCATC 
CCCGACAAAG TGGAAATGCT GCTGACCGTG CGAGCATTCA AGCCCGAGGT CCATAAGCAC 
ATCCTGGAGT CGATTACGCG GATCACCAAA GCGGAAGCGG CGGCGGCGGG TGCGCCTCAG 
GAACCGAAAA TCGAGGCAAG CGAGGCGTTG CGCTTCACTA CCAACGACCC GGCACTGGCG 
GCGCGCCTTG CCAGCGTGTT GACGCCGGTG TTGGCAAAGA ACAACATTCT CACGGATCAA 
CGGCGCATGG TGTCGGAAGA CTTCGGTGCA TTCGGAAATG CCGCAGGCGT TCCCAGCGTC 
CTGATGCTCA TTGGCGCCGT GCCCCCGGAA AAATTTGCGG AGGCGCAGAA AACCGGAGAT 
CCGTTGCCTT CATTGCATTC TTCACAGTGG GCACCGGACC TCGAACCGGC AATGCGCACA 
GCAATCCTTA CAGAAGTTAC CTCGGCTTTG GATTTGTTCT CTGGTACAAA GTAA

Protein sequence

MKAFWAVVLL CLSSVPFFGA NPPADLKAKV DQLLPQLRAF YIDLHQSPEL SLHEENTAAK 
LAAGLRKLGF EVTEHVGGTG VVGVLKNGDG PVVLIRTELD ALPVEEQTGL PYASKVKTKN 
ASGQEVSVMH ACGHDLHMAS WLGTATLLSQ NKSLWHGTLL MIGQPAEEIG AGADAMIKDG 
LLTRFPKPDY SIAVHDDSAM PAGQVDVTGG PVFAAAASVK ITIYGRGGHG AQPQTTVDPI 
VIAARTILSL QTIVSRELSP LDPAVVTVGA IHGGTKNNII PDKVEMLLTV RAFKPEVHKH 
ILESITRITK AEAAAAGAPQ EPKIEASEAL RFTTNDPALA ARLASVLTPV LAKNNILTDQ 
RRMVSEDFGA FGNAAGVPSV LMLIGAVPPE KFAEAQKTGD PLPSLHSSQW APDLEPAMRT 
AILTEVTSAL DLFSGTK