Gene VC0395_A0251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0251
Symbol
ID	5136233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	260275
End bp	261675
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	50%
IMG OID	640531709
Product	putative protease
Protein accession	YP_001216207
Protein GI	147674148
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGC CAAAAACCTT TGTTCCAGAA CTCCTTTCAC CTGCGGGTAG CCTGAAGAAT 
ATGCGCTACG CTTTTGCCTA CGGGGCAGAT GCGGTATATG CCGGCCAACC TCGTTACAGC 
CTGCGCGTAC GTAACAATGA GTTCAACCAC GAAAACCTAC AAATCGGCAT TAATGAAGCC 
CACGCACTGG GTAAAAAATT CTATGTGGTG TGTAACATTC AGCCGCACAA CTCTAAGCTG 
AAAACCTTCA TCCGTGACCT TAAGCCGGTG ATTGATATGG GGCCGGATGC GCTCATCATG 
TCTGACCCTG GCCTTATCAT GATGGTTCGT GAAGAATTCC CGCACATGCC GATCCACCTG 
TCGGTACAAG CGAATGCGGT GAACTGGGCA ACCGTGAAAT TCTGGGCTTC ACAAGGCGTT 
GAGCGTGTGA TTGTTTCTCG TGAGCTCTCT TTAGAAGAAA TCGAAGAGAT CCGCGAAAAA 
TGCCCGAATA CCGAAATTGA AGTGTTCGTG CATGGCGCTC TATGTATGGC TTATTCCGGT 
CGTTGCTTGC TGTCTGGTTA CATCAACAAG CGCGATCCAA ACCAAGGTAC TTGCACTAAC 
GCATGCCGTT GGGAATACAA AGTTGAAGCA GCAAAAGAAG ATGAAGCAGG TCAGATCGTT 
GAACAGTTTG ACCCTAATGC AGCACAAGCC ATCGAAGTTC AAAATGAACG TCCAGACACC 
ACCATCGGGG CCGGCAAACC GATTGATGAT GTCGTACTGC TTTCTGAGAG CCATCGTCCT 
GATGAGAAAA TGGCCGCCTT TGAAGATGAG CACGGCACCT ACATCATGAA CTCCAAAGAT 
CTGCGTGCAG TACAGCATGT TGAGCGCCTA ACTCAAATGG GTGTGCACTC ACTGAAAATC 
GAAGGCCGTA CCAAATCTTT CTACTACTGC GCACGTACCG CGCAAGTGTA CCGTAAAGCG 
ATTGATGATG CGGTAGCGGG CAAGCCATTC GATGATAGCC TGATGACTAC CCTAGAAAGC 
TTGGCGCACC GTGGCTATAC CGAAGGTTTC TTACGTCGCC ATACGCACGA TGCTTACCAA 
AACTACGACT ACGGCTACTC GGTTTCCGAC ACTCAACAGT TTGTCGGTGA ATTTACCGGT 
AAACGCCGCG GCGCAATGGC CGAAGTGGAA GTAAAGAACA AATTTGTGCT CGGCGATAGC 
CTTGAGCTGA TGACGCCAAA AGGCAATGTC ATCTTCACTT TAGAAGCGAT GGAAAACCGC 
AAAGGTGAAG CAACAGATGA TGCCAAAGGC AACGGTCACT TTGTTTACAT TCCAGTTCCG 
GAAGAGTTGG ATCTCAGCTA CGCACTGCTG ATGCGTAACC TAGTGCAAGG GCAGGATACC 
CGTAACCCAA CAGGCAAGTA A

Protein sequence

MTTPKTFVPE LLSPAGSLKN MRYAFAYGAD AVYAGQPRYS LRVRNNEFNH ENLQIGINEA 
HALGKKFYVV CNIQPHNSKL KTFIRDLKPV IDMGPDALIM SDPGLIMMVR EEFPHMPIHL 
SVQANAVNWA TVKFWASQGV ERVIVSRELS LEEIEEIREK CPNTEIEVFV HGALCMAYSG 
RCLLSGYINK RDPNQGTCTN ACRWEYKVEA AKEDEAGQIV EQFDPNAAQA IEVQNERPDT 
TIGAGKPIDD VVLLSESHRP DEKMAAFEDE HGTYIMNSKD LRAVQHVERL TQMGVHSLKI 
EGRTKSFYYC ARTAQVYRKA IDDAVAGKPF DDSLMTTLES LAHRGYTEGF LRRHTHDAYQ 
NYDYGYSVSD TQQFVGEFTG KRRGAMAEVE VKNKFVLGDS LELMTPKGNV IFTLEAMENR 
KGEATDDAKG NGHFVYIPVP EELDLSYALL MRNLVQGQDT RNPTGK