Gene VC0395_A1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1104
Symbol	prc
ID	5137552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1160197
End bp	1162194
Gene Length	1998 bp
Protein Length	665 aa
Translation table	11
GC content	44%
IMG OID	640532562
Product	carboxy-terminal protease
Protein accession	YP_001217050
Protein GI	147673268
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc) [TIGR01543] phage prohead protease, HK97 family

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000000153479
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATGCC GTTCAAAAAT ATCTCTGATT GCTGCTAGCC TATGGCTGGC AGCCTTTTCA 
GCTCAGGCTC TAGAAGCCAA ACTCAAACCA GAAGATCTCC CTCTTCTTGT TCCTGAAGCT 
CAACACGCAA CGGCAGCGAA ACGTGTTACC TCACGTTTTA CCCGTTCTCA TTACAAACAA 
TTCAATTTAG ACGACCAGTT TTCTCAAGCC ATGTTTGAAC GCTACCTTGA GATGCTAGAT 
TACAGTCGAA ATATCTTTAC TCAAGCGGAC ATAGACAGCT TCAAAGCTTG GTCTTTGCAA 
TTGGATGACC AATTAAAAGC AGGTGACAAT CAAATCGCTT ACGATCTGTA TAACCTGTCA 
ATGGAAAAAC GTTTTGAGCG CTTTCAATAC GCACTTTCTC TGCTTGATCA AGAGATGACG 
TTTGATGCTG ATGAGTCTAT TGAGCTTGAT CGCACGAAAT CGCCTTGGCC AAAAGATCTT 
AAAGAGATTA ACGAGCTGTG GAGACAACGA GTTAAATACG ATGCGTTAAG CTTGAAACTG 
GCAGGTAAAG AGTGGCCAGA AATCAAAGAA ACGCTCGATA AACGCTACAA CAATGCCATC 
AAGCGCCTCA CACAGACAAA AAGTGAAGAC GTATTTCAAA CTTATATGAA TGCGTTTGCT 
CGTGAAGTTG ATCCGCATAC CAGCTATTTG TCACCGCGTA ACGCAGAACA ATTCCAATCT 
GAAATGAATC TCTCGTTGGA AGGAATTGGT GCCGTGTTAC AAATGACCGA CGATTACACC 
ATCATCCGCT CATTGGTTGC AGGTGGTCCT GCAGCATTGA GCAAACAATT GGGTGAGGGT 
GACCGCATTA TCGGCGTCGG TCAAGAAGGC GAAGATGTGG TTGATGTAGT CGGTTGGCGA 
TTAGACGATG TCGTTCAACT GATTAAAGGA CCTAAAGGTA GCAAGGTGAA ACTGCTCGTG 
TTACCTGAAG GCAAAGACGC AAAAAGTCAC GTTGTCACTA TTGTGCGAGA TAAAATTCGC 
TTAGAAGATC GCGCCGTAAA ATCTGAAGTG ATTGAAAAAG CAGGGAAGAA AATTGGTGTA 
CTAGAAGTAC CGAGTTTCTA CGTTGGCTTA GCTCAAGACA CGGAAAAACT ACTGGCGGAG 
CTAAAAGCGA AAAAAGTCGA CGGCATTATT GTTGATTTAC GCAATAACGG TGGTGGTGCA 
TTAACCGAAG CTACCGCGCT TTCTGGTTTG TTCATTACCA GTGGCCCTGT AGTTCAGGTG 
CGTGATAGCT ATGGTCGAGT CAACGTTAAC TCGGATACCG ATGGTAGCAT TAGCTATAGC 
GGACCAATGA CCGTGCTGAT TAACCGCTAC AGTGCATCGG CTTCAGAAAT CTTTGCTGCC 
GCAATGCAAG ACTACGGCCG CGCGATCATT CTCGGTGAGA ACTCATTTGG TAAAGGTACC 
GTACAGCAGC ATCGCTCTCT CAATCATATC TATGATTTGT TTGATAAAGA GCTTGGCTAC 
GTACAATACA CGATTCAAAA ATTTTACCGT ATTGATGGTG GTAGTACCCA AAACAAAGGT 
GTCGTCCCTG ATATCGCGTA TCCCACCGCG ATTGACCCTT CCGAAACAGG GGAAAGTGTT 
GAAGATAACG CACTACCGTG GGACAGCATT GATGAAGCAA AATATGAGCG TTTGAATAAC 
TTCAACACCA TCATTGCTAG CTTGGAAGCT AAACACCAAC AACGTGTCGC GAATGATTTA 
GAATTTGGTT TTATCGAGCA AGATATTGCG AAATACCGTG CAGAGAAAGA TGACAACCTA 
CTTTCGCTGA ATGAAAAAGT ACGCAAAGAA GAGAGTGCTA AGGCTGATGA AGAGCGCTTA 
GCTCGCATCA ATCAACGCCA AAAAGCGTTA GGTAAATCGA CCTATGCGAG CTTGCAAGAT 
ATACCGAAAG ATTATGAAGC ACCGGATGCT TATCTCGATG AATCGGTTAA CATTATGCTT 
GACATGATAT CGCGATAA

Protein sequence

MKCRSKISLI AASLWLAAFS AQALEAKLKP EDLPLLVPEA QHATAAKRVT SRFTRSHYKQ 
FNLDDQFSQA MFERYLEMLD YSRNIFTQAD IDSFKAWSLQ LDDQLKAGDN QIAYDLYNLS 
MEKRFERFQY ALSLLDQEMT FDADESIELD RTKSPWPKDL KEINELWRQR VKYDALSLKL 
AGKEWPEIKE TLDKRYNNAI KRLTQTKSED VFQTYMNAFA REVDPHTSYL SPRNAEQFQS 
EMNLSLEGIG AVLQMTDDYT IIRSLVAGGP AALSKQLGEG DRIIGVGQEG EDVVDVVGWR 
LDDVVQLIKG PKGSKVKLLV LPEGKDAKSH VVTIVRDKIR LEDRAVKSEV IEKAGKKIGV 
LEVPSFYVGL AQDTEKLLAE LKAKKVDGII VDLRNNGGGA LTEATALSGL FITSGPVVQV 
RDSYGRVNVN SDTDGSISYS GPMTVLINRY SASASEIFAA AMQDYGRAII LGENSFGKGT 
VQQHRSLNHI YDLFDKELGY VQYTIQKFYR IDGGSTQNKG VVPDIAYPTA IDPSETGESV 
EDNALPWDSI DEAKYERLNN FNTIIASLEA KHQQRVANDL EFGFIEQDIA KYRAEKDDNL 
LSLNEKVRKE ESAKADEERL ARINQRQKAL GKSTYASLQD IPKDYEAPDA YLDESVNIML 
DMISR