Gene Avi_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_2201
Symbol
ID	7387907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	-
Start bp	1807666
End bp	1809591
Gene Length	1926 bp
Protein Length	641 aa
Translation table	11
GC content	60%
IMG OID	643651388
Product	serine protease
Protein accession	YP_002549582
Protein GI	222148625
COG category	[I] Lipid transport and metabolism
COG ID	[COG0671] Membrane-associated phospholipid phosphatase
TIGRFAM ID	[TIGR02601] autotransporter-associated beta strand repeat

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC TCTCTTCAAT CGCCGCTTTC GCGGCTGTCC TTTCACTTGC AACAGCGCTG 
ACGCCAGCCT TCGCAGATGG CCTCACCCTG CCCCCAGTTC CAGCCGGTGT CGGCCATGCC 
GATAGCGCGC CGCCACCGGC AGGCGTCATG GCCTATGTGG ATACCGGCGC CACCAACCAG 
CGCGGCGATG CCTGCCATGC GACACCACAG ACCAATGCCG GCGTGCGTGT TCTGTCCGGC 
TTCCTGGAGC TTTGGACCCC TCGTACGCCC TTTGTCGACG CCGATCAGGA AGCACCGGCC 
AAGGATGGCT GCCCGGCGAT TGCCAAATCG GACTGGAGCG GCATTCCCGG CAGCCCGACC 
GATGGGGTCA AGAAGCTCCC GAAATTGCAT GAGCAGAATC TCGCCTATTC CATCAAGGTC 
ACCGGCGAAC ATACGCCGGA ACGCGATCTG GCCGCCTATC TGGATGACCG GCGGGGCAAG 
AATGTCAGCA TTACCGATGG TCTTGGTCCC CTGGCCGATG CCTGGCGCCA GGGCGTGCGT 
CAGACCACGA CGATCACCGG CATGCCCGCT GACGCGACCA CCGTCAAATA TGACGACAAG 
GGCAATAATC GCGGCGTCGG CTCCAAGGAC AATACAGATC TCGGCAAGGC CGTCGATCTG 
ATCGAGGCGG GCAGTGCCGA TGGTTCAACT GAGCCTGCCA AGCGCTATTA CAAATATGCC 
CGTCCTTACC GCGCCAGCGA CAAGGTGCGG ATCGTACCGC AACTGGAACT GGCCAAGAGC 
GACAAACCGG CCTCCGACGG CGGCTTCCCC TCCGGCCATA CCGCCGAAGC CTGGCGCGAT 
GCGCTGGTGA TGGCCTATCT GGTGCCGCAG CGCTATCAGG AAATGCTGAC CCGCGCCGCC 
ATGCTCGGCG AAAACCGCAT TCGCGCTGGC ATGCACCAGA CCTTCGACGT GCTGGGCGGG 
CGGGTGTTGG CCACCGCCAT CGTCGCCTAT AATCTCAACC GGCCGGACTA TACGCCGCTG 
CGCAGCGAAG CCTATCAGCA GAGCCAGACA TGGCTGATGA AGCAAACCGG TGCAAAAGAT 
GGCCAGGCGC TGCTGGCGGC GGCCCATGCT CTTCCGAAAT CGACGGATGC CTATGCCGAT 
TACGCCTGGA ACAAGCAATT TTTCGAACCA CGCCTGACCT ATGGCTACAA GCAGATCGGC 
GATCCATCCT TGGCGCCCAG CGTGCCCAAG GGTGCCGAAG TGCTGCTGGA AACCCGCCTG 
CCCTATCTTA GTGCCGATCA GCGCCGGGTC GTCTTGAAAA CCACGGAAAT TGCCTCTGGC 
TATCCAATCA TCAATGATCC GGAAGGCTGG GGTCGTCTCG ACCTGTTCCG CGCCGCCGAT 
GGTTATGGTG CGTTCGACGG TGATGTTACC CTTATTATGG ATGGTACCAA AGGCGGCTTT 
AACGCCGACG ACACCTGGAA AAACCCGATT TCCGGCAAAG GCAAGCTGAC CAAGCAGGGC 
AGCGGCACAC TGACGCTGTC AGCCAACAAC AGCTGGAGCG GCGGCACGGT GATCGAGGAC 
GGTCGCCTTG TTGCGCAATC ACCGACTGCC TTTGGCAAGG GCGATGTGTA TCTTGCTGGT 
GGCACGATGG ACATTGCCTC CGCGCCTCTG ACCGTGACCG GCACCCTGAC GCTGCGCAAG 
GATGCGACCC TGGAAATTAC CTCCACCAAA GCCACGAAAG CGCCAAGCCT TGCTGTCAGC 
AAGACGCTGT TCATCGACGG TGGAAAACTG GTGGTCAAGC CTAACGGTCA ATGGAAAGCC 
GGACAGACCA TCAAGTTGAT CACTGCCACC AGGATTGCTG GAAAATTCGG CGCTATCGAA 
GTTGATGGCC ATAAGGTCAA GGCGGTTTAC GGTAAGAAAA CCATCTCCCT GCGCATCGAA 
GGATAA

Protein sequence

MKKLSSIAAF AAVLSLATAL TPAFADGLTL PPVPAGVGHA DSAPPPAGVM AYVDTGATNQ 
RGDACHATPQ TNAGVRVLSG FLELWTPRTP FVDADQEAPA KDGCPAIAKS DWSGIPGSPT 
DGVKKLPKLH EQNLAYSIKV TGEHTPERDL AAYLDDRRGK NVSITDGLGP LADAWRQGVR 
QTTTITGMPA DATTVKYDDK GNNRGVGSKD NTDLGKAVDL IEAGSADGST EPAKRYYKYA 
RPYRASDKVR IVPQLELAKS DKPASDGGFP SGHTAEAWRD ALVMAYLVPQ RYQEMLTRAA 
MLGENRIRAG MHQTFDVLGG RVLATAIVAY NLNRPDYTPL RSEAYQQSQT WLMKQTGAKD 
GQALLAAAHA LPKSTDAYAD YAWNKQFFEP RLTYGYKQIG DPSLAPSVPK GAEVLLETRL 
PYLSADQRRV VLKTTEIASG YPIINDPEGW GRLDLFRAAD GYGAFDGDVT LIMDGTKGGF 
NADDTWKNPI SGKGKLTKQG SGTLTLSANN SWSGGTVIED GRLVAQSPTA FGKGDVYLAG 
GTMDIASAPL TVTGTLTLRK DATLEITSTK ATKAPSLAVS KTLFIDGGKL VVKPNGQWKA 
GQTIKLITAT RIAGKFGAIE VDGHKVKAVY GKKTISLRIE G