Gene Avi_5349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_5349
Symbol	dppA
ID	7380705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011988
Strand	+
Start bp	347965
End bp	349584
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	57%
IMG OID	643648966
Product	ABC transporter substrate binding protein (dipeptide)
Protein accession	YP_002547203
Protein GI	222106412
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.60385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTC GTCTATTCGG CGGAGCTGTG GCCGTGTCGG TTGCTGCTTT GCTCACCAGC 
CCGGCTGTTG CTTTTGAAGG CAGAAGCGTT GTGGCGCCCG ATTGCAACTA TGGTGGCAAG 
ATCAAGTCCA TCGTGGCGAC CGATGAGCAC ACGGTGACCT TCTCCATGTG CTCGCCCGAT 
CCGGCCTTCA AAGCCAAGGC GGCTTTCGTA CCCTTCGGCA TCCAGCCGGC CAAGCATATC 
GAAGAGGCTG GTCCGAAGAA GAAGCTGCTC GACAATCCGA TCGGCACTGG GCCGTTCAAG 
CTGGAAAGCT GGAATCGCGG CGATTCCATC ACCATGACCC GCAACGAGAA TTACTGGGGT 
GCCAAGCCGG CTTTCGACAA GCTGGTGTTT CGCTGGAATC AGTCCGGCGC GGGCCGCCTG 
AATGAATTGC GCTCCGGCAC GGTCGATGAA ATCACCAATA TCAGCCCGGA TGATTTCGAC 
AGTGTCAAGA ACGATCCGGA CCTGCAATTC CTGCCGCAGG AAAGCCCGAA CATTCTCTAT 
CTCGGCATGG TCAACACCGC CAAGCCTTTT GACAATGAGA AGGTGCGCCA GGCGATTGCC 
ATGGGCATCG ATCGCCAGCG CATCGTCGAT AATTTCTATC CAAAAGGTTC GGTCGTCGCC 
AGCCATTTCA CGCCCTGTTC GCTGCCCAAT GGCTGCGCTG GCAAGGATTG GTACGGGTTT 
GATGCGAGCG CGGCTAAAAA ACTGCTGGCC GATGCCGGAT ACCCGAATGG GTTCAAGACC 
AAGATCTACT ACCGCGATGT GTTCCGCGCT TACCTGCCGG AACCAAGCGT CGTGGCTGTC 
GAATTCCAGA CGCAGCTGAA GAAAAATCTC GGCATCGATG CGGAAGTGGT TCCGATTGAA 
TCGGGTAAAT TCATTGATGA TACCTCCGCT GGCCGGATCG ATGGGCTCTA TCTGCTGGGT 
TGGGGGGCTG ACTATCCGCA TGTCACCAAC TTCCTCGATT ATCACTTCGG CAAGACATCG 
AAAATGTTCG GCACCACTTT CCCGGAAATT ACCGAGGGGT TGACCAAAGG CGGAACGATT 
GCTGAGACAA AGACCGCCGA ACCGATCTAT GCGGCCGTCA ACGATGCCAT TCGCCAGCAT 
GTGCCGATGG TGCCGATTGT CCATGGCGCC GCCGCCTATG CCGCTCGGGC GACCTTGAAG 
AATGCCATCG TCCGCCCCTT TGGCTCGCCG TTGTTGCAGG ATTCCAATCC GGGTAAGGAT 
ACGCTGGTCT TCATGCAGAA TGCCGAGCCG ATCAGCCTCT ATTGCGGCGA TGAAACGGAT 
GGCGAAACGC TGAATGCCTG CACGCCGATT ACGGAAGCGC TGCTGGATTA TGCAAAGGAC 
AGCGGCGATA TTGTTCCCGC TCTGGCCACC AGCTGTGATG CCAATGCGGA TTCGACCGTT 
TGGACCTGCA AGCTGCGGAC CGGCGTGAAA TTCACCGACG GCTCTGATTT TACCGCCAAT 
GACGTGGTGG TATCCTGGGC GGCGGGCATT GATGCATCCA ATCCGGCCCA TGTCGGCAAT 
ACCGGCTCCT TCGACTATTT CTCCTCCCTC TGGGGCGGAT TGATGAACGC CAAGAAGTAA

Protein sequence

MKFRLFGGAV AVSVAALLTS PAVAFEGRSV VAPDCNYGGK IKSIVATDEH TVTFSMCSPD 
PAFKAKAAFV PFGIQPAKHI EEAGPKKKLL DNPIGTGPFK LESWNRGDSI TMTRNENYWG 
AKPAFDKLVF RWNQSGAGRL NELRSGTVDE ITNISPDDFD SVKNDPDLQF LPQESPNILY 
LGMVNTAKPF DNEKVRQAIA MGIDRQRIVD NFYPKGSVVA SHFTPCSLPN GCAGKDWYGF 
DASAAKKLLA DAGYPNGFKT KIYYRDVFRA YLPEPSVVAV EFQTQLKKNL GIDAEVVPIE 
SGKFIDDTSA GRIDGLYLLG WGADYPHVTN FLDYHFGKTS KMFGTTFPEI TEGLTKGGTI 
AETKTAEPIY AAVNDAIRQH VPMVPIVHGA AAYAARATLK NAIVRPFGSP LLQDSNPGKD 
TLVFMQNAEP ISLYCGDETD GETLNACTPI TEALLDYAKD SGDIVPALAT SCDANADSTV 
WTCKLRTGVK FTDGSDFTAN DVVVSWAAGI DASNPAHVGN TGSFDYFSSL WGGLMNAKK