Gene Avi_3889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_3889
Symbol
ID	7388569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	-
Start bp	3248969
End bp	3250021
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	61%
IMG OID	643652636
Product	dipeptidase
Protein accession	YP_002550817
Protein GI	222149860
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.741978
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTGG TTTTCGACGG GCATAATGAT GTCCTCCTGC GTTTGTGGAG GGCTCATGCA 
GCGGGCGTCG ATCCGGTGCG GCAATTCATC AATGGCACAC GGGAAGGTCA TATCGATGCG 
CCACGCGCCC GCCGGGGCGG GCTTGGTGGC GGTCTCTGCG CGATTTATAT TCCCTCCGAT 
GGCGAGTTCG TGCTGACCGA GCCGGATGAC AAGGGCCACT ACAATACCCC TGTTGATAAG 
CCCCTGGCGC GTGCATCCTC ACTCGACATC GCCTTGCAGA TGGCCGCGAT TGCGCTGCGG 
GTCGAGCGGG CGGGGGGCTG GCGGCTGTGC CGCTCGACAT CGGATATTCG CGCTGCAATG 
GCCGAGGGCG TCTTTGCCGC CGTGCTGCAT ATGGAAGGCT GCGAGGCCAT CGATGCTGAT 
CTGGCCGCCC TTGAGGTGTT TTACCAGGCG GGCCTGCGCA CGCTCGGCCC GGTCTGGAGC 
CGCCCGAATA TTTTCGGGCA TGGTGTTCCC TTCGCCTTTC CAATGTCGCC GGATACCGGG 
CCGGGTCTGA CGACACTCGG TTTTGAGCTT GTGAAAGCCT GCGACCGGCT GGGCATTGCC 
CTCGACCTTG CCCATATCAC CGAAAAGGGC TTCTGGGACG TGGCGAAAAC CTCCGACAAA 
CCGCTGATCG CCAGCCATTC CAATGCGCAC GCGCTGACAC CAGTGGCCCG CAACCTGACG 
GATCGGCAGA TGGACGCGAT CCGCGAGCGC AAGGGCATCG CCGGTTTGAA TTACGCCGTG 
ACCATGCTGC GCTCCGATGC CCGCGATTTT GCCGAGACCC CGCTGTCAGA TATGGTACGC 
CATATCGACT ATATGGTGGA ACGCATGGGT ATCGATTGCG TCGGCCTCGG CTCCGATTTC 
GACGGTTGCA CGGTGCCCGG TGCAATCGGT GATGCCAGTG GGAACCAGAG GTTGCTTGAA 
GCGTTGCAAT CGGCTGGATA CGGTGATGCA GATATTGCTA AGATTGCCCG TGAAAACTGG 
CTGCGGGTGC TGGGGACGAC GTGGGGCGAG TAA

Protein sequence

MQLVFDGHND VLLRLWRAHA AGVDPVRQFI NGTREGHIDA PRARRGGLGG GLCAIYIPSD 
GEFVLTEPDD KGHYNTPVDK PLARASSLDI ALQMAAIALR VERAGGWRLC RSTSDIRAAM 
AEGVFAAVLH MEGCEAIDAD LAALEVFYQA GLRTLGPVWS RPNIFGHGVP FAFPMSPDTG 
PGLTTLGFEL VKACDRLGIA LDLAHITEKG FWDVAKTSDK PLIASHSNAH ALTPVARNLT 
DRQMDAIRER KGIAGLNYAV TMLRSDARDF AETPLSDMVR HIDYMVERMG IDCVGLGSDF 
DGCTVPGAIG DASGNQRLLE ALQSAGYGDA DIAKIARENW LRVLGTTWGE