Gene Avi_3702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_3702
Symbol	pepF
ID	7388176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011989
Strand	+
Start bp	3066232
End bp	3068091
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	60%
IMG OID	643652491
Product	oligoendopeptidase F
Protein accession	YP_002550673
Protein GI	222149716
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR02290] oligoendopeptidase, pepF/M3 family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTTCA GCCCCGTTAA CCAGACCCGC CTTCCGGCAG CCGAATCCGC CAGCGTACCA 
GCGCACGGCC AAGGCCTCGG CACGCTGCCC GAATGGCAGC TCACCGATCT TTATCCGGCC 
CCCTCCTCGG ATCTCTTCAA GGCCGACCTC GCCAAGGCCA GCGAAATGAG CCTGGCCTTC 
GAGACCAAAT GGAAGGGGCG GCTGGAAGAT GCCGCCGCCA AGGACGCGGA TCAGGGCCTG 
GGAGCCGCGC TGAAGGAATT CGAAGAACTC GAAGACCTAC TCGGCAAGAT CGGCTCCTAT 
GCCGGTCTCT ATTATTATAG TGAGATGACC AAGCCGGAAA ACGGCAAATT CTTCGGCGAT 
GTACAAGCCA GGCTGACGGA GCTTGCCGCC CATCTGCTGT TTTTCACGCT GGAGCTGAAT 
CGGCTGGACG ATGCGGTGAT CGATGCTGCC ATTGCCCGCG ATCCGGCCAC CGCCCATTAC 
AAGCCCTGGC TGATTGATCT CAGGCAAGAC AAGCCCTACC AGCTGGATGA CAAGCTCGAG 
CAATTGTTTC TGGAAAAATC CCAGACCGGT TCGGCGGCCT TCAACCGGTT GTTCGACGAG 
ACCCTGGCAA GCCTGCGGTT TGAGATTGAC GGCGAACAGC TGACGCTGGA ACCGGTTCTG 
ACCATGTTGC AGGAGGCCGA TCCGGCCTTG CGCGAAAAGG CGGCCATGGC GCTGTCGAAG 
ACCTTCAAGG ACAATATCCG GATTTTCGTG CTGGTCACCA ATACCTTGGC CAAGGACAAG 
GAAATTTCCG ATCGCTGGCG CGGCTTTGCC GACATTGCCG ATAGCCGCCA CCTGTCCAAC 
CGGGTGGAGC GTCCGGTGGT CGATGCGCTG GCGGCTGCGG TGCGCGATGC CTATCCGCGC 
CTGTCGCACC GCTATTACAA GATGAAAGCC AAGTGGCTGG GCATGGAGCA GATGAATTTC 
TGGGACCGCA ACGCCCCTCT GCCCGACAGT ATCGACCGGA TCATTCCCTG GGACGAAGCC 
CGCCAGACCG TGCTGTCGGC CTATGGCGGC TTTGCGCCTG ATATGGCCGA AATCGCTGGT 
CGCTTTTTTG ATGGCGGCTG GATCGATGCG CCCGCCCGCC CTGGCAAGGC GCCGGGCGCC 
TTTGCCCATC CGACCGTGCC GTCTGCCCAT CCCTATGTTT TGGTCAATTA CCTCGGCAAG 
CCGCGCGACG TGATGACGCT GGCCCATGAA CTGGGCCACG GCGTGCATCA GGTTCTCGCT 
GGCGAACAGG GCGCGCTGAT GTGCCAGACG CCGCTGACGC TGGCCGAGAC CGCCTCGGTA 
TTCGGCGAAA TGCTGACCTT CCGGGCGCTT CTGGAAAAGG CCACGGATGC GCGTGAGCGC 
AAGGCCATGC TGGCCCAGAA AGTCGAGGAC ATGATCAACA CGGTCGTGCG CCAGATCGCT 
TTCTACGAAT TCGAGCGCAA GCTGCACACC GCCCGCAAGG AGGGCGAGTT GACGGCGGAA 
AAGATTGGCG AACTGTGGCT ATCGGTGCAG GAAGAGAGCC TTGGACCGGC CATCAAAGTG 
TCCGAGGGCT ATGAGACCTG GTGGGCCTAT ATCCCCCATT TCATCCATTC GCCTTTCTAT 
GTCTATGCCT ATGCCTTCGG CGATTGCCTG GTCAATTCGC TCTATGCCGT CTACCAGAAT 
GCCGAACAGG GCTTCCAGCA GAAGTATTTC GACCTGTTGA AGGCTGGCGG CAGCAAGCAT 
CATTCCGAAC TTCTCGCACC GTTCGGTCTG GATGCCACCG ACCCGTCCTT CTGGGCCAAG 
GGTCTATCGA TGATCGAAGG GTTGATCGAC GAGCTGGAAG CGCTTGACGC CAAAGCCTGA

Protein sequence

MPFSPVNQTR LPAAESASVP AHGQGLGTLP EWQLTDLYPA PSSDLFKADL AKASEMSLAF 
ETKWKGRLED AAAKDADQGL GAALKEFEEL EDLLGKIGSY AGLYYYSEMT KPENGKFFGD 
VQARLTELAA HLLFFTLELN RLDDAVIDAA IARDPATAHY KPWLIDLRQD KPYQLDDKLE 
QLFLEKSQTG SAAFNRLFDE TLASLRFEID GEQLTLEPVL TMLQEADPAL REKAAMALSK 
TFKDNIRIFV LVTNTLAKDK EISDRWRGFA DIADSRHLSN RVERPVVDAL AAAVRDAYPR 
LSHRYYKMKA KWLGMEQMNF WDRNAPLPDS IDRIIPWDEA RQTVLSAYGG FAPDMAEIAG 
RFFDGGWIDA PARPGKAPGA FAHPTVPSAH PYVLVNYLGK PRDVMTLAHE LGHGVHQVLA 
GEQGALMCQT PLTLAETASV FGEMLTFRAL LEKATDARER KAMLAQKVED MINTVVRQIA 
FYEFERKLHT ARKEGELTAE KIGELWLSVQ EESLGPAIKV SEGYETWWAY IPHFIHSPFY 
VYAYAFGDCL VNSLYAVYQN AEQGFQQKYF DLLKAGGSKH HSELLAPFGL DATDPSFWAK 
GLSMIEGLID ELEALDAKA