Gene Avi_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_3033
Symbol
ID	7388602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	-
Start bp	2523430
End bp	2524461
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	59%
IMG OID	643652007
Product	hypothetical protein
Protein accession	YP_002550191
Protein GI	222149234
COG category	[R] General function prediction only
COG ID	[COG2842] Uncharacterized ATPase, putative transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00438308
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGC ACATCAACAC AAGTCAGTTT AACGGCGCTT CCTGGGAGCG CCCCGTCCAG 
GCACCTGAGG TTTCTGCAAA CAAGAGTGAT GCCGATATCG AAAAGTGGTG GGAGCTGATT 
GACCGCGTTA TTGCCGTTGC CCGGCAGTTC CGGTGGACGA AGGCGGAAGT TACCCGCCGG 
TCGGGCATGA AGGAAGGCAC GTTTAGCCAG TGGTTTTCCG GCCGCTACGA AGGGCGGCTG 
GACGGTCACA ACACCATGAT TGAACAATGG CTGGATGCCT TGGAAGCCAG TGCCAGCATT 
GCGGCGATGA TTCCGCAATC GCCGCCCTTC ATGAAGCTTC GCGGTTCGGC GGAGGTGCTG 
GAAACGCTGA CGTGGGCGCA GATTTGCCCC GATCTGGTGA TGATCACGCT GGGCGCTGGC 
ATGGGCAAGA CCGCGACATG TGAGTATTTC ACCAACACGC GCCCGCATGT CTATCACGCC 
ACCGTTTCTG AGAGCACCAA GACGGTTCAC GGCATGTTGA CGGAGCTGGC CGAGCAGCTC 
GCGGTTCAGG AGAACAACCC GGCGCGTCTG GCGCGGGCGA TCGGGACCAA GTTGAAGCGG 
ACCGGTGACG GGACGTTGCT GATCGTTGAC GAGGGCCAGC ACCTTAACGA CGAGGCGCTC 
AACCAGCTTC GCCATTTCGT GGATGTGTAC AAATGCGGTG TGGCCGTCGT TGGCAACTCG 
GAGGTCTATA GCCGGTTTGC CAGCAACAAA AAGGGGCCGA GTTATGCCCA GCTGAAAAGC 
CGCATCGGTA AGCGCCTGCA ACGGGTGCAG CCCTATCCGG ATGACTTGCA AACCTACATT 
GCCGCCTGGA ATGTAACCGA TCCGGCCTGC ATCAAGTTTC TGATGGGCAT CGGCTTGAAG 
GGCGGTGCCT TCCGGCAGAT CGAAAAGACA ATGCGCATGG CCTTGATGGT GGCGCTTGGG 
GCAGGGACCG AGGTTGGCTT AAAGGACATT CAGGCCGCCT GGAAGAACCG CGACGTGGAG 
GACATGGCAT GA

Protein sequence

MNKHINTSQF NGASWERPVQ APEVSANKSD ADIEKWWELI DRVIAVARQF RWTKAEVTRR 
SGMKEGTFSQ WFSGRYEGRL DGHNTMIEQW LDALEASASI AAMIPQSPPF MKLRGSAEVL 
ETLTWAQICP DLVMITLGAG MGKTATCEYF TNTRPHVYHA TVSESTKTVH GMLTELAEQL 
AVQENNPARL ARAIGTKLKR TGDGTLLIVD EGQHLNDEAL NQLRHFVDVY KCGVAVVGNS 
EVYSRFASNK KGPSYAQLKS RIGKRLQRVQ PYPDDLQTYI AAWNVTDPAC IKFLMGIGLK 
GGAFRQIEKT MRMALMVALG AGTEVGLKDI QAAWKNRDVE DMA