Gene VC0395_A0959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0959
Symbol
ID	5136849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	988401
End bp	989507
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	49%
IMG OID	640532417
Product	M20A family peptidase
Protein accession	YP_001216905
Protein GI	147673074
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01883] peptidase T-like protein

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA TTAATACCCA ACGCCTTGTT GACCACTTCC TGCAACTGAT TCAGATCGAT 
AGCGAATCGG GCAATGAAAA AAAGATTGCT GAAACGCTCG CGGAGCAACT GGGCGAACTT 
GGTTTCACCG TACATAAACT CCCTGTTCCG GCGGAGGTGT CAAACGGCTT TAACCTGTAT 
GCCCGCCTAG AAGGCACACT CAATGACAGT ATTCTGTTTA GTTGCCACAT GGATACGGTT 
AAACCGGGTA TCGGCATTGA GCCTGTGATT GAAGATGGCA TTATCCGTTC CAAAGGCAAC 
ACGATTTTGG GTGGCGATGA CAAATCTGGC ATTGCCGCGA TCCTTGAAGC GGTACGTGTT 
CTGCGCGATA GCCAGCAAGC GCACAAAACC ATTGAGATTG CTTTCACTGT GCATGAAGAA 
GGCGGTCTGA AAGGTTCTGA GCATTTTGAT ATGAGTAAGG TGCAAGCAGA GAAAGCGATT 
GTTCTCGACA CAGGTGGCCC AATCGGCACT ATCGTGCGTG CAGCACCGGG TCAGCAAAAA 
ATCGTCGCAC AGATCAAAGG TAAACCCGCT CATGCTGGTT TAGTACCGGA AGATGGAATC 
AGCGCCATTG CGGTGGCCGC TGATGCAATT ACTCAAATGA AACTGCTGCG AATTGACGAA 
GAAACCACGG CTAACATCGG TATTGTGCAA GGCGGTCAAG CGACGAACAT TGTGATGCCT 
GAGCTGAAAA TCGTGGCGGA AGCGCGTTCA CTCAACGATG CCAAACTCGA AGCGCAAGTT 
CAGCACATGA TCGAAACTTT TGAACGTGCC GCGGAAAAGC ATGACGCAAC CGTTGAGATT 
GAATCGACTC GCGCTTACAA CGCCTTTAAG TTGGAAGAAG ACAACGCGCA TATCCAAGCG 
ATCAAAGCGA GCTTTGAAAC AATCGGTATT GAGCCGAAAA CCAAGCTGAG TGGTGGTGGC 
AGCGATGCCA ATAATTTCAA TGCGAAAGGG TTAACTACGG TAAACCTCTC AACCGGTATG 
GCTAAAGTGC ATACTACTGA AGAGTACATC GCGATTGCGG ATATGGTGAA AATTGCCGAA 
TTCGTCTGCG CTTACACTAC CGCCTAA

Protein sequence

MSLINTQRLV DHFLQLIQID SESGNEKKIA ETLAEQLGEL GFTVHKLPVP AEVSNGFNLY 
ARLEGTLNDS ILFSCHMDTV KPGIGIEPVI EDGIIRSKGN TILGGDDKSG IAAILEAVRV 
LRDSQQAHKT IEIAFTVHEE GGLKGSEHFD MSKVQAEKAI VLDTGGPIGT IVRAAPGQQK 
IVAQIKGKPA HAGLVPEDGI SAIAVAADAI TQMKLLRIDE ETTANIGIVQ GGQATNIVMP 
ELKIVAEARS LNDAKLEAQV QHMIETFERA AEKHDATVEI ESTRAYNAFK LEEDNAHIQA 
IKASFETIGI EPKTKLSGGG SDANNFNAKG LTTVNLSTGM AKVHTTEEYI AIADMVKIAE 
FVCAYTTA