Gene Avi_1523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_1523
Symbol
ID	7386481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	-
Start bp	1273881
End bp	1274936
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	57%
IMG OID	643650889
Product	extracellular metalloprotease precursor protein
Protein accession	YP_002549094
Protein GI	222148137
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.103754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGTTG CCATGTGCCG CTATTGCCAA ATCATTCCCG AAAAAGTGCT GATTGCCCTA 
TCCCGTGACC AGGATTTTCC AGCCGCCGTG CGCGAGCGGT TACAGGAAAC CATGCATCAC 
GACCATCAAC TGCGCCAGTT TCGCGACAGC GCCCGCCAGC TGACCATCGC CAAACGGCCT 
TTCCGGGCGT TTTCCGTGAC CGTGGCCCAG GCACCTGATA TCCCGGTCTA TACCTGCAAT 
AACGGCATGA CCCTTCCCGG CGTACAGATC GCCAATCCCG GCTCTTCAAC GGATGCCCAG 
GTGAAGACCA CATTCGATAC AACGACCGGG GTGGAGCAAT TCTACAGCAG CGTCTTCAAG 
CGTAACTCCA TCGACGGCAA TGGCATGACG ATCCTGTCGT CTGTGCATTA CGGCAGGGAT 
TACAACAACG CCTTCTGGAA CGGCTCGCAA ATGGCCTATG GCGATGGCGA CGGGGAGATT 
TTCACCCCGT TTTGTGAGAG CGCCGATGTG GTCGGCCATG AACTGACCCA TGGCATCACC 
CAATATACCC TGGGCCTCGA CTATGAAAAC CAGCCGGGTG GGCTGAATGA AAGTCTCTCG 
GATGTGTTCG GCAGCATGTT CAAGCAATGG ACGAAAGATC AGAATGCCGA TGAGGCCGAC 
TGGCTGATCG GCAATGACAT TCTCGGCCCG ACGGCCCGGC AGAAATATAC CTGCCTGCGC 
GACATGGCCA ATCCTGAAGC ATCCCATTGC ATGGCCGAGC AGATCAGCCA TTTCAGCGAT 
TACCGCGATG GCATGGACCC ACATGAGAGC AGCGGCATCG CCAACCGCGC CTTTTATCTA 
GCCGCCACCC GCATCGGCGG CAAAAGCTGG GACAAGGCCG GACAGATATG GTATGATGCA 
CTCACAAAGA ATGGCAGCAA CCCGGACATG ACCATGGCGG AATTTGCCGA TGCGACCCGG 
GCCGGAGCTG CCAGGCTTTA TCCAGGAGAT GGATCGCTCG CAGAGGTGCT CGACACCGCC 
TGGAGCGAAG TGGGTCTGCA AAGTGCTTCG GTCTGA

Protein sequence

MEVAMCRYCQ IIPEKVLIAL SRDQDFPAAV RERLQETMHH DHQLRQFRDS ARQLTIAKRP 
FRAFSVTVAQ APDIPVYTCN NGMTLPGVQI ANPGSSTDAQ VKTTFDTTTG VEQFYSSVFK 
RNSIDGNGMT ILSSVHYGRD YNNAFWNGSQ MAYGDGDGEI FTPFCESADV VGHELTHGIT 
QYTLGLDYEN QPGGLNESLS DVFGSMFKQW TKDQNADEAD WLIGNDILGP TARQKYTCLR 
DMANPEASHC MAEQISHFSD YRDGMDPHES SGIANRAFYL AATRIGGKSW DKAGQIWYDA 
LTKNGSNPDM TMAEFADATR AGAARLYPGD GSLAEVLDTA WSEVGLQSAS V