Gene Avi_8020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_8020
Symbol
ID	7365150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011982
Strand	+
Start bp	21013
End bp	22674
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	58%
IMG OID	643641702
Product	trehalose synthase
Protein accession	YP_002539999
Protein GI	222080136
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID	[TIGR02456] trehalose synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATCAACG ACCTCTGGTA CAAGAACGCT GTCGTCTACT GCCTGTCCGT CGAGACCTTC 
ATGGATGCCA ACGGCGATGG AGTGGGCGAT TTTCAGGGGC TGCAACGGCG GTTGGATTAT 
CTGGCCGGTC TGGGCGTCAA TGCCATCTGG CTGATGCCGT TTCAGGCCTC TCCGGGTCTC 
GATGATGGCT ACGATGTCTC CGACTATTAC AACATCGATC CCAGATACGG CACCCTCGGC 
GACTTCGTCG AATTCACCCA TAGCGCAAAG CAACGCGGTA TACGGGTGCT GATCGACCTC 
GTCGTCAATC ATACGTCCGA TCAGCATCCC TGGTTCAAAC AGGCCTGCGC CGACAAGAAT 
TCCCGATACA GGGACTGGTA CGTATGGTCT GAGAAGAAGC CGGAAAATGC CGACGAGGGC 
ATGGTCTTTC CTGGTGTACA AAAGACCACA TGGACACGGG ACGAAAAGTC CGGCGAATAC 
TATTTTCACC GTTTCTTCAA ATTCCAGCCG GATCTCAACA CCAGCAATCC ACATGTCCAG 
GCGGAAATCC TCAAGATCAT GGGTTTCTGG ATACAGCTCG GCGTATCGGG TTTTCGCATG 
GACGCCGTTC CCTTCGTGAT CGCCGAAAAG GGTGCAGATG TGAAGGAATC GAAGCCGCAG 
TTCGATCTGT TGCGCAGTTT CCGCGAGTTC CTGCAGTGGC GCAAGGGTGA CAGCATCATC 
CTTGCGGAGG CCAATGTCGT GCCCAAGGAG AACCTGCAGT ATTTCGGCGA CGACGGCGAT 
CGTATGCAGA TGATGTTCAA TTTCCACGTC AACCAGGCTC TGTTCTACGC GCTCGCTAGC 
GCCGATACCC GGCCCCTTGA CAAGGCGATG AACGAAACCC GGGAGCGACC GCAAACGGGG 
CAATGGGGAA TATTCCTGCG CAACCACGAC GAACTCGATC TTGGCCGGCT GACGGAAAAA 
CAGCGGCAAG CCGTGTTTTC CGCCTTCGGT CCAGACAAGG ACATGCAGCT CTATGATCGG 
GGGATACGGC GTCGCCTAGC GCCGATGCTG GGCGGCGATA CCAGGCGTCT CAGGCTTGCT 
TATAGCCTGA TGTATTCGCT GCCGGGCACC CCGGTCCTGC GATATGGTGA CGAGATCGGC 
ATGGGAGACG ACCTAGCATT GGAGGAGCGC AACTGCGCCC GCACGCCTAT GCAATGGTCG 
ACCGAGCCGC ATGGCGGCTT CACCAAGGCG GAAAAACCCG TCTTGCCCGT CATCGAAGGA 
GGTCCCTATG GGTTCGAACA TGTCAATGTC GCGGCACAGC GGCGGGACGC GGAATCGATG 
CTGAACTGGA CCGAGCGGAT GATCCGTATG CGAAAGGAAG CCCCTGAAAT CGGATGGGGA 
AGTTTCAGCG TTCTGGACTG CGGCGATACC GGTGTCCTGG CGATGCGCTA CGACTGGCGC 
CACAACGCCG TCGTCATCAT CCACAATCTC CACGACAAGC CAGTCGATAT CTCGTTCGAT 
CCCGGCGTAG GTGAGAGTGG ACGCGTCCTG ATCGACATCG CCGACGGCAG CGACAGCAGC 
GCGGACGAGA AAGGCCGGCA TAACATGGTG ATCGAGCCAT TCGGTTATCG CTGGTACCGC 
GCCGGCGGGC TCGATTACCT GCTCAAGAGA AGCGACATCT GA

Protein sequence

MINDLWYKNA VVYCLSVETF MDANGDGVGD FQGLQRRLDY LAGLGVNAIW LMPFQASPGL 
DDGYDVSDYY NIDPRYGTLG DFVEFTHSAK QRGIRVLIDL VVNHTSDQHP WFKQACADKN 
SRYRDWYVWS EKKPENADEG MVFPGVQKTT WTRDEKSGEY YFHRFFKFQP DLNTSNPHVQ 
AEILKIMGFW IQLGVSGFRM DAVPFVIAEK GADVKESKPQ FDLLRSFREF LQWRKGDSII 
LAEANVVPKE NLQYFGDDGD RMQMMFNFHV NQALFYALAS ADTRPLDKAM NETRERPQTG 
QWGIFLRNHD ELDLGRLTEK QRQAVFSAFG PDKDMQLYDR GIRRRLAPML GGDTRRLRLA 
YSLMYSLPGT PVLRYGDEIG MGDDLALEER NCARTPMQWS TEPHGGFTKA EKPVLPVIEG 
GPYGFEHVNV AAQRRDAESM LNWTERMIRM RKEAPEIGWG SFSVLDCGDT GVLAMRYDWR 
HNAVVIIHNL HDKPVDISFD PGVGESGRVL IDIADGSDSS ADEKGRHNMV IEPFGYRWYR 
AGGLDYLLKR SDI