Gene Avi_4158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_4158
Symbol	dcp
ID	7386934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	-
Start bp	3506323
End bp	3508407
Gene Length	2085 bp
Protein Length	694 aa
Translation table	11
GC content	59%
IMG OID	643652852
Product	peptidyl-dipeptidase
Protein accession	YP_002551025
Protein GI	222150068
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.964957
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATTTC CAGACCGTAA TCTTGGCCCC AACGGTGCCT TTGCCACCGT CACCGAATGG 
AATGGGCCGC ATGGCCTGCC GAATTTCACC GCCATCGGCG ATGAGGATTT TGTCCCGGCT 
TTCGACATGG CGCTGGCTGA ACACGACGCT GATATCGACA CCATCGCCCA TTATCCGTCG 
GAGCCGACAT TCGACAACAC CATCGTTGCG CTGGAGATAG CCGGGGACGG CCTGTCGCGG 
GTCTCGGCGC TGTTCTGGAA CAAGGCCGGT GCCGATACCA ATCAGGTTAT CCAGGCGCTG 
GAGCGCGAGA TCGCGCCGAA AATGTCGCGC CACTATTCAA AGATCAGCAT GAATGCCGCA 
CTGTTTGCCC GCGTCGATGC CTTATGGGAA AAGCGCGACA GCCTGGGCCT GACGCTGGAG 
CAGACCCGGG TGCTGGAGCG GCACTGGAAA GGCTTCGTCA AGGCTGGTGC CAAGCTCGCC 
AAGCCCGAAC AGGAGCGGTT GGCGGCGATC AATGAGCGGC TGGCCAGCCT CGGTGCCAAT 
TTCGGCCAGA ATGTGCTGGG CGATGAGACC GATTGGGCAT TGCCGCTGAC CAGCGATGAC 
GAGCTGGCGG GCATTCCCGA TTTTCTGAAG GATGCGATGG CCTCTGCCGC GCAAGCCCGT 
GGCAAGGGGG AATCCTATGC CGTGACGCTG TCGCGCTCGG TCATCGTCCC CTTCCTGACC 
TTTTCCGAGC GGCGGGACCT GCGCGAAACA GCCTTCAAGG CCTGGGTGGC GCGTGGTGAA 
AACGGTGGTG AACGTGACAA CCGCGCCATC GTTACCGAAA CCCTGGCGCT TCGGGCGGAA 
AAGGCCAAGC TATTGGGCTA CAAGAATTTT GCCGCCCTGA AGCTCGACAA TACCATGGCC 
AAGACCCCGG AAGCGGTCAA CGGCCTGCTG ATGCAGGTCT GGGAACGCGC CGTCGCCCAA 
GCCGCCATCG AAGAGCAGGA ATTGGCGGAG TTGATTGCCA AGGACGGTAA GAATCACGCG 
GTTGCGCCCT GGGATTGGCG TTTTTATGCC GAGAAGCTGC GCTCCGAGCG GTTCAATTTT 
TCGGAAGCTG AACTGAAGCC TTATCTGCAA CTGGAAAAAA TCATCGAAGC CTGCTTTGCC 
GTGGCGCAAA AGCTGTTCGG CATCACTGCC GTGCCGCTGA AGGACGTGAA GGGCTATCAC 
CCCGATGTGC GGGTATTTGA AATCCGCGAG GCGGATGGGA CAGTGAAGGC GCTGTTCCTT 
GGCGATTATT TCGCCCGGTC CTCGAAGCGC TCCGGTGCTT GGATGAGCTC CTTCCAGTCG 
CAGCACAAGC TGCCGCTGAA GAACGGTGCG CAGGGCGAAT TGCCGATCAT TTACAATGTC 
TGCAATTTCG CCAAGCCTGC CGAAGGCAAG CCAGCGCTGC TGTCGCTGGA CGATGCCCGC 
ACGCTATTTC ATGAATTCGG TCATGCCCTG CATGGGATGC TGTCTGATGT CACTTACCCG 
TCAGTATCGG GCACGGCGGT GTCGCGTGAC TTTGTCGAAC TGCCCTCGCA GCTCTATGAA 
CATTGGCTGA CGGTGCCGGA TATCCTGAAA ACCTATGCCG TGCATTACCA GACCGGTGAG 
GCCATGCCAC AGGCCTTGCT CGATAAGGTT CTGGCAGCGC AAACCTTCAA TGCCGGGTTC 
GATACGGTCG AATTCACCTC TTCGGCGCTG GTCGATATGG CGTTTCACAC CCGGGAGGAT 
CGAGTGGCCG ATCCGATGGC GGTGCAGGCC GAGATTCTCC AAAATATCGG CATGCCGTCC 
TCCATCGTCA TGCGCCATGC CACACCGCAT TTCCAACATG TGTTTTCCGG CGATGGCTAT 
TCGGCTGGCT ATTATTCCTA CATGTGGTCG GAAGTGCTGG ATGCCGATGC CTTCGAGGCT 
TTCGAGGAAA CCGGCAATGC CTTCGACCCT GATATGGCAG AGCGCCTGAA GGACAATATC 
TACGCCATTG GCGGTGCAGT GGACCCGGAA GAAACCTACA AGGCTTTCCG TGGCCGGTTG 
CCGAGCCCGG AAGCGATGTT GAAGAAGCGC GGGCTTGCGG CATAA

Protein sequence

MTFPDRNLGP NGAFATVTEW NGPHGLPNFT AIGDEDFVPA FDMALAEHDA DIDTIAHYPS 
EPTFDNTIVA LEIAGDGLSR VSALFWNKAG ADTNQVIQAL EREIAPKMSR HYSKISMNAA 
LFARVDALWE KRDSLGLTLE QTRVLERHWK GFVKAGAKLA KPEQERLAAI NERLASLGAN 
FGQNVLGDET DWALPLTSDD ELAGIPDFLK DAMASAAQAR GKGESYAVTL SRSVIVPFLT 
FSERRDLRET AFKAWVARGE NGGERDNRAI VTETLALRAE KAKLLGYKNF AALKLDNTMA 
KTPEAVNGLL MQVWERAVAQ AAIEEQELAE LIAKDGKNHA VAPWDWRFYA EKLRSERFNF 
SEAELKPYLQ LEKIIEACFA VAQKLFGITA VPLKDVKGYH PDVRVFEIRE ADGTVKALFL 
GDYFARSSKR SGAWMSSFQS QHKLPLKNGA QGELPIIYNV CNFAKPAEGK PALLSLDDAR 
TLFHEFGHAL HGMLSDVTYP SVSGTAVSRD FVELPSQLYE HWLTVPDILK TYAVHYQTGE 
AMPQALLDKV LAAQTFNAGF DTVEFTSSAL VDMAFHTRED RVADPMAVQA EILQNIGMPS 
SIVMRHATPH FQHVFSGDGY SAGYYSYMWS EVLDADAFEA FEETGNAFDP DMAERLKDNI 
YAIGGAVDPE ETYKAFRGRL PSPEAMLKKR GLAA