Gene VC0395_0075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_0075
Symbol	ptrB
ID	5134047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	-
Start bp	81858
End bp	83855
Gene Length	1998 bp
Protein Length	665 aa
Translation table	11
GC content	51%
IMG OID	640530398
Product	protease II
Protein accession	YP_001214916
Protein GI	147672486
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1770] Protease II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000000167862
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGC TCAATGTATT GCTGTTAACG ACATCTCTGT CGGTTTTTTA TACTTATGCA 
GAGACGGATT ATCAATGGTT ACGCGATGAC TCGCGTTCGG AACCTGCGGT GAAGCAGTTT 
TTGGCTGAGC ATAATCGAAA AACCGATCAT TGGTTTGCAC CTGCCAAGCC ACTGGTGCAA 
GAGTTGGTCA ATGAATGGCA ACAAACTTCA CAGCATAAAG CGCCTCCGCC TGCGCTTATC 
TACGCAAACC AGCAGTACAA CGATATTCAA TGGAATGGTC ATCGGCACAT CGTCAAGATA 
GGTGCTCAAG GCCAAATTGA GCCTCTGCTG AATCTTAGCG CGCGTGCAGA GCCGTTTGAT 
TATTACCAAT TGGCTTCTTG GTCACTTGAT CGCTCAGTCC AATCGGTAGC GTTGGCAGAA 
GATACGCGGG GTGACGAGCA GTTTAAGCTG ACGATCGTGC GTTTAGCCGA TCGCACCGAG 
CAGATCGTTT CAGAAACAGC GAGCACTTAC TTTGCTTGGG CGGCCGATGG CAAAAGCCTC 
TACTACTTAT CTGATCTCAA TGGGTCTACC CAGCTGCAGC GTTTTGAGCT AGAAACGGGT 
CAATCAACGA GGCTTGCAGA GTGGCGCTCG GCAGAGTGGC TGTTCTCGCT CTATTCTGCA 
AGCAATCCAC GCTATATCGT GGTACAGCAA AATAATGAAA ACTCGACTCA GCAGCGCCTG 
CTGGATACCC AAACCGGTGA GCTGATGCCA TGGCTACGCA CCACTGAGCT GGGGCTGGAA 
TATTATGCCG ATGTGCTGGG TGAGACACTT TACATCAATA GCAACCATGA GGGGGCATTT 
CGTCTCTATC GTCAGCCGTT ACACACTAAA CAGGAATGGC AAAGCGTCAC AACACATAAA 
GAAATCGGCT CACTGAGCAA CTTTTATCTG TTTGATGCTG GGATTGTGTT GGTGGAGAAC 
CAAACTCTTG CACCGAAAGT TTGGGTTCTC GATAGCCAAG GCGAAGTGCG TACTCACTTT 
GAACTGCGCG ATTTAGGTCA AGTGGCGTGG ATCTCTCGCA ATGGTGATGC TGCCAGTAAT 
CGGCTGCGTG TACGTGCAAT GTCAATGACG GAGCCTGCTA GCTGGCATGA GTTGGATGTG 
GCACAGTTAC AGTGGCAACA GTTAAGCCAA GATCACTACG CAGACTTTGA CCCGAAACAG 
TATCAAACCC AAACGGTATG GGTGACGCAA GGTGCCATCC AAGTTCCGGT GACACTGGCC 
TACCGCTCTG ACAAACTGAC CCCCAACAGC AGTGTGGTGC TGTATGGCTA TGGCGCTTAT 
GGCGTGACGA TGAAGCCCTA TTTCATGCCA CAAATGGTCA GTTTGCTTGA TCGAGGCATG 
ATTTACGCGA TCGCTCATGT TCGTGGTGGT GGATACCTTG GCGAGGCTTG GTATCAAGCT 
GGCGCTGGAC TCAATAAACA AAACGGCATT GATGATTTCC TCGCGGCCGC TCGATATCTC 
ACCCATTTTC AGCAAGGTGA GCGCGCCATT TATGCGATCG GCGGAAGTGC CGGCGGCACC 
TTGGTTGCTG CGGCGCTCAA TCAGCAGCCC AACCTATTTG CGGGAGCTGT GCTGCAAGTG 
CCGTTTGTCG ATGTGTTAGC CAGTATGAGT GATACCAGTC AAGCCTTGAC GGCGCAGCAG 
TATCAAGAAT GGGGTAATCC TCAACAGCCA GAGCAGCGTC AAGTGATGCA AGCTTATGAT 
CCATTCAGCA ATCTACGTGC TGCTCCTTAC CCTCCGACGT TGGTTAATGT CGGTTGGTGG 
GACAATCGAG TGCCCTATTG GGAAGGGGCT CGCTATTTGG CACGTTTGAG TGATGTCTCA 
CAAGGGGCTG GTCCTTACCT TTTATCAACC GATTTTCAGG CGGGTCACGC CAGTGATCGG 
CGTCAAGCGC TTGAAAAGCA GGCGCGTGAA TATGCGTTCT TTCTCACCTT AGATAAAACC 
AGAAAAGCGG GGCAGTAA

Protein sequence

MKLLNVLLLT TSLSVFYTYA ETDYQWLRDD SRSEPAVKQF LAEHNRKTDH WFAPAKPLVQ 
ELVNEWQQTS QHKAPPPALI YANQQYNDIQ WNGHRHIVKI GAQGQIEPLL NLSARAEPFD 
YYQLASWSLD RSVQSVALAE DTRGDEQFKL TIVRLADRTE QIVSETASTY FAWAADGKSL 
YYLSDLNGST QLQRFELETG QSTRLAEWRS AEWLFSLYSA SNPRYIVVQQ NNENSTQQRL 
LDTQTGELMP WLRTTELGLE YYADVLGETL YINSNHEGAF RLYRQPLHTK QEWQSVTTHK 
EIGSLSNFYL FDAGIVLVEN QTLAPKVWVL DSQGEVRTHF ELRDLGQVAW ISRNGDAASN 
RLRVRAMSMT EPASWHELDV AQLQWQQLSQ DHYADFDPKQ YQTQTVWVTQ GAIQVPVTLA 
YRSDKLTPNS SVVLYGYGAY GVTMKPYFMP QMVSLLDRGM IYAIAHVRGG GYLGEAWYQA 
GAGLNKQNGI DDFLAAARYL THFQQGERAI YAIGGSAGGT LVAAALNQQP NLFAGAVLQV 
PFVDVLASMS DTSQALTAQQ YQEWGNPQQP EQRQVMQAYD PFSNLRAAPY PPTLVNVGWW 
DNRVPYWEGA RYLARLSDVS QGAGPYLLST DFQAGHASDR RQALEKQARE YAFFLTLDKT 
RKAGQ