Gene Avi_5072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_5072
Symbol
ID	7381226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011988
Strand	-
Start bp	63703
End bp	65487
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	56%
IMG OID	643648740
Product	hypothetical protein
Protein accession	YP_002546977
Protein GI	222106186
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAAACA ATACGAGTGC GACTTCGATC ATCTGCGTAT CATCTCATGA CGCTGCGCCA 
AGTGTGGGCA CGGCAGACAC AGAATTGGCA AGCCCGACAC CGGGACAGAT ACGCGACGCG 
CTGGATCAAC TCTGCAACGG CAATACATTC GCAACGGCAA AGCGCTCCCG ACAGTTGCTA 
CAGTATCTTG TCGAGGAGGC GCTCGCGGGT CGCGCGAATG CCATTGGCGA ACATGCGATC 
GCTCAGGACG TATTCGGCAA AGATGAGCAT TTCGATCCGC GGATCGATAC ATGTGTCCGG 
ACCGAAGCCT GGCGTCTTCG CAACAGATTG CAAAGCTATT ACGAACATGA GGGACGCTTC 
GATGTCGTGA GGGTGGCGTT CATGCCCCGC TCACTCGTGC CAATCTTCTC CTCGCAGCCA 
TCCTTGCCCG CGGCGGATAT AAAAGATTTT CCGCGCCGGA TTGGCATTCA TATGGACTGC 
GAACCCGATG CCGGCGGGAA CGAACAGCAC TTGGCGCGAC GGCTACCCGA AGAGATTGCC 
AGCAGCCTTT TCAAGCTTTC TTCGATAGTC CCGGTTCTTC CTGGCGGAGC GAGTAGATCA 
GAGCTGGAGT TACGGTGCGC CATTCGCTCC GATGAGCAAT GGATCAGGAT CGTGACGACA 
ATGGTCGATC TGGATGGCTT GGTTCAAGGA AGTAAAACCT TTTCTTTCTC ACGCAATACC 
GCGAAACCCT CTCCCACCTT GATAGCCAAT GCCATCGGCG AAATGGTTTC AGATTCGCTG 
TCACGCAACA TCCTGGGTCA GGCGGTGAAC ATACCATGCC ATTCTGACGA GAACGAGAAC 
CGGTTTCTTG ACCAGCTTCT GCGCGGTTCC CACATCAACC GGCGTGAGCG GTTGATCGAG 
CTGCGCGCCG CCGTCTTGCG CTATGAACAA ATCATCTCCG ACGACCCCTT GGATCAATTG 
TCTCACCGGA GGCTTATTGG CGCTTTAGGA CAGTTTTTAT CGCTTGCGCC GGGCTCGATA 
TCCAGGGTGA TGCCCAAGCT GGCCGCCTCT GCCCACAGCG CTTTGTCGCT GAATGGCAAC 
CTCAGCGACG TCTGGCTGAT CTTGGGTTGG GCGTCGAGCT ACGCCTATGA CTGGCCACAG 
ACCGAAGGCG CATGCCGCCA GGCCATTGCC ATCACCCCGC TCGACCCTTC GCCCTACATA 
TTGCTTGCGT TGACCTATCT GCAAAGTGGA CAGATCGTTT CTGCGCTGCA AATAGCGGAG 
GAAGCGATCA ATCTCGATCC TTATTCCCCC ATGGTGGCCA ATGTTTATGC GCTAACGCTG 
AATGCAGCCC GCCGTTTCAG GGAGGCAGCG AAAGTCGCAC GCGACGCCCT TGATGCCGAA 
CCCGGATTTG TTAAGTTACG GCTTACCTAT GGAGAAGCCA AGCTCAACAT GGGTCAGATT 
GATAGCGCTA TCGAAGAATT TACTGCCGCC TCACGCATCA TGACCGAAGA TGCCACGGCC 
TGTGGGCTGC TAGGACTAGC CTATGGGCTT TCAGGCGAAA GATCAGAGGC GGATCGTCTT 
CTTTCCAGGG TGAAGCAGTC ACCAAATCTG CGAGGCCAAG CTGTGCATGC GGAGGCGATG 
ATCCATCTCG GACTAGGCGC TCGCGATGAA GCCATTAGCG CTTTGGAGCT GGCGGTGACA 
CGAAGAGGCA CACCAGGGCT GTTTCTGGCA AATGCCGTTT TCGATCCCAT TCGGGATGAC 
AGCCGCTTTT CAAGAATTCA ACATCAGATG GAGCTGGCAC ATTAG

Protein sequence

MENNTSATSI ICVSSHDAAP SVGTADTELA SPTPGQIRDA LDQLCNGNTF ATAKRSRQLL 
QYLVEEALAG RANAIGEHAI AQDVFGKDEH FDPRIDTCVR TEAWRLRNRL QSYYEHEGRF 
DVVRVAFMPR SLVPIFSSQP SLPAADIKDF PRRIGIHMDC EPDAGGNEQH LARRLPEEIA 
SSLFKLSSIV PVLPGGASRS ELELRCAIRS DEQWIRIVTT MVDLDGLVQG SKTFSFSRNT 
AKPSPTLIAN AIGEMVSDSL SRNILGQAVN IPCHSDENEN RFLDQLLRGS HINRRERLIE 
LRAAVLRYEQ IISDDPLDQL SHRRLIGALG QFLSLAPGSI SRVMPKLAAS AHSALSLNGN 
LSDVWLILGW ASSYAYDWPQ TEGACRQAIA ITPLDPSPYI LLALTYLQSG QIVSALQIAE 
EAINLDPYSP MVANVYALTL NAARRFREAA KVARDALDAE PGFVKLRLTY GEAKLNMGQI 
DSAIEEFTAA SRIMTEDATA CGLLGLAYGL SGERSEADRL LSRVKQSPNL RGQAVHAEAM 
IHLGLGARDE AISALELAVT RRGTPGLFLA NAVFDPIRDD SRFSRIQHQM ELAH