Gene Acid345_2277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2277
Symbol
ID	4073271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2699778
End bp	2701883
Gene Length	2106 bp
Protein Length	701 aa
Translation table	11
GC content	59%
IMG OID	637984293
Product	dipeptidyl-peptidase 7
Protein accession	YP_591352
Protein GI	94969304
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATCTGT GCCGGGTCCC CTGCAAGCTC CTCTCCCTCC TCGTTATTGC CTTCTGCACT 
TTTACGACTT TCGCACAAGC CGATGAAGGC ATGTGGCTTT TCACCAACCC GCCTACGGCG 
GCGATCCAGA AGAAATATGG CTTCGCCATC ACCCAGGAAT GGCTGGACCA CCTCCGGCTG 
TCTTCATCGC GCGCGCCGGG CGGGTCGAGT GAGTTCGTTT CGCCCGACGG ACTGCTGATG 
ACGAACCATC ACGTGGCGCA GAGCTGCATC CACGACCTTT CGAGCGGCGG CAAGGACTAC 
ATGAAGGACG GCTTCTACGC TGCGACGCGC GAGCAGGAAC CGAAATGCCC GGGTATCGAG 
TTTCTTGTGC TGACGGATAT CAAAGACGTC TCGGAACAGA TCCACTCGGC CGTGAAGGCG 
CGCATGGCCT CCGCGGAATC CGGCAAAGCC ACGCGGCAGG CGATGTCGGC CGCCGAGAAA 
GCCTGCTCTA CCGAGGGCTT CAAGTGCGAC GTCGTGACGC TCTACGCGGG CGCGATGTAT 
CACCTTTACA AGTACAAGAA GTACACCGAC GTCCGGCTGG TGTTCGCGCC TGAGTTCCAA 
ATGGCGTTCT TCGGCGGCGA TCCTGACAAC TTCACCTTCC CTCGCTACGA CCTCGACATT 
ACGTTCTTCC GCATGTACGA GAACGGTAAA CCGGCGCATA CCGAAAACTA TCTGAAGTTT 
GCCAAGAAGG GCGTGAAGGA GGGCGACCTA CTCTTCGTGA GCGGGCACCC CGGTCGTACC 
AGCCGCCTGC TGTCCATCGC CGAACTTGAG TACCTGCGCG ACGTGCAGTA TCCGTGGCAG 
ATCAAGAACC TGACCCGTCG CGTCAACCTG CTGCTTGCGT TTTCGAAGGA AGGAGCTGAG 
CAGGCGCGCG AAGCCGAGCA CGATCTGTTC AGCTTCCAGA ATTCGCAGAA GGCCCTCACC 
GGCTACAACA CGTTCTTCGC GAACAAAGAA GGCTGGGCGA AGAAGCAGGC TGACGAAAAA 
CAGTTCCGCG ATTACGTAAA AGCCCACGCC GAACGCGAGA AAGAATTTGG CGATCCGTGG 
ACTGAGGTGA ATCAAGCCGA GGGCACGCAG CGCGGGATGT TCTTCGATTA CCAGTACGTC 
GAAATGCTCG CCGGGCTGCG CGGTTCGCTG GCTGCCGACG CGCGATTCAT CGTCCGTGCA 
GCTCAGCAGC GGACCTTGCC GAATGACCAG CGCCTTCGTG GCTATACCGA CTCTGCCCTG 
GCGACGCGCG AGCAAGAGCT GTTCTCCGAC GCGCCCGCGT ACAAAGACCT GAACAAAGCA 
ATGCTGGCGG ACAGCCTCGC CGATATGCAG GAACAGGAAC CGAAGAATCC GTCGTTGCTG 
AAAGTGCTTG CCGGGAAATC CCCGAAAGAC CGCGCGGCAG AATTGATTGA CGGCAGCAAG 
CTCGACGACG CGGCCTACCG CAAGAAACTG TACGACGGCG GATTGAAGGC GGTGGAAGAA 
AGTACCGATC CGCTGGTCGT GATGATGCGC AGCATCGAAC CGCAGGCGCT CGCGCTTCGC 
CAGAAGTTCG ACGACGAAGT GGATCCGAAG CTCCGCGATG GCGGGGCGAA AATCGCGAAA 
GTTCGCTTTG CGATCTTTGG CCAGACCCAG CCACCCGACG CCACCTTTAC TCTGCGGCTG 
AGTTACGGGC CGGCGAAGGG CTACGAAGAA AACGGGAAAC ATATTCCGTG GAGCACCACC 
ATGGACGGCG CGTACAAGCA CGCCGCCGAT CACGGAAACA AATCGCCCTA CGAATTACCG 
AAGAGCTGGA TGGACGCCAA GGGCAAGTTC GACGGCAACA CGCCCTTCGA CGTCGTTACG 
ACCGCGGACA TTATCGGCGG AAATTCTGGC AGCCCGGTGG TCAACACCAA CGGAGAACTA 
GTCGGCATCA TCTTCGACGG CAATATCGAG TCGCTGCCGC TGAACTTTAT GTACGACGAT 
CTGCAGGCCC GCGCAGTGCA CGTGGATTCA CGCGCGATCC TCGAGTCGCT GCAGAAGATC 
TACCACGCCG ATGCGCTGTA CGAAGAAATC ACGGGCGCTT CGGGTATCAG CGCGGCCAAA 
CAGTAA

Protein sequence

MYLCRVPCKL LSLLVIAFCT FTTFAQADEG MWLFTNPPTA AIQKKYGFAI TQEWLDHLRL 
SSSRAPGGSS EFVSPDGLLM TNHHVAQSCI HDLSSGGKDY MKDGFYAATR EQEPKCPGIE 
FLVLTDIKDV SEQIHSAVKA RMASAESGKA TRQAMSAAEK ACSTEGFKCD VVTLYAGAMY 
HLYKYKKYTD VRLVFAPEFQ MAFFGGDPDN FTFPRYDLDI TFFRMYENGK PAHTENYLKF 
AKKGVKEGDL LFVSGHPGRT SRLLSIAELE YLRDVQYPWQ IKNLTRRVNL LLAFSKEGAE 
QAREAEHDLF SFQNSQKALT GYNTFFANKE GWAKKQADEK QFRDYVKAHA EREKEFGDPW 
TEVNQAEGTQ RGMFFDYQYV EMLAGLRGSL AADARFIVRA AQQRTLPNDQ RLRGYTDSAL 
ATREQELFSD APAYKDLNKA MLADSLADMQ EQEPKNPSLL KVLAGKSPKD RAAELIDGSK 
LDDAAYRKKL YDGGLKAVEE STDPLVVMMR SIEPQALALR QKFDDEVDPK LRDGGAKIAK 
VRFAIFGQTQ PPDATFTLRL SYGPAKGYEE NGKHIPWSTT MDGAYKHAAD HGNKSPYELP 
KSWMDAKGKF DGNTPFDVVT TADIIGGNSG SPVVNTNGEL VGIIFDGNIE SLPLNFMYDD 
LQARAVHVDS RAILESLQKI YHADALYEEI TGASGISAAK Q