Gene VC0395_A0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0049
Symbol	gcp
ID	5136340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	45948
End bp	46967
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	50%
IMG OID	640531509
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001216022
Protein GI	147675246
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000000000462165
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATTA TTGGTATTGA AACCTCTTGT GACGAAACGG GTATCGCGAT TTACGATGAC 
GAAAAAGGAC TGCTGTCTCA TAAGCTTTAC AGTCAGGTAA AACTGCATGC CGATTATGGT 
GGTGTGGTGC CTGAGCTGGC TTCGCGTGAT CATGTAAAAA AAACCATCCC ACTCATCAAA 
GCGGCGATGG CAGAGGCAAA CGTGACGCCG CAAGATTTAG ACGGTGTGGC TTTTACCGCA 
GGCCCCGGTT TGGTTGGGGC GCTCTTGGTT GGCGCTACGA TTGGGCGCAG TTTAGCGTAC 
GCTTGGGATG TGCCAGCGGT GCCGGTTCAT CACATGGAAG GGCATCTTCT TGCTCCGATG 
CTGGAAGAGA ATCCGCCGCC GTTTCCGTTT GTCGCTTTGC TGGTATCGGG TGGTCACACC 
ATGCTGGTGG AAGTGAAAAA CATTGGTGAA TACCGCATTT TAGGTGAGTC TATCGATGAT 
GCGGCTGGCG AAGCCTTTGA TAAAACGGCC AAATTGATGG GATTGGATTA TCCAGGTGGC 
CCGTTATTGG CCAAGCTGGC GGAAAAAGGG ACTCCGGGAC GCTTTAAATT TCCCCGTCCT 
ATGACGGACA GACCGGGGCT CGATATGAGC TTTTCCGGTT TAAAAACTTT TACTGCCAAT 
ACCATTGCTG CAAATGGCGA CGATGAACAG ACCCGTGCGG ATATTGCTTA CGCCTTCCAA 
GAGGCCGTGT GTGACACTTT AGTCATTAAA TGTAAACGCG CATTGGAGGA GACAGGACTT 
AAGCGTGTGG TGATTGCGGG TGGTGTGAGT GCCAACAAGC AGTTGCGTGC TGATTTGGAA 
AAACTCGCGA AAAAAATCGG TGGCGAAGTG TATTACCCAC GTACTGAATT TTGTACCGAT 
AACGGAGCGA TGATCGCTTA TGCGGGCATG CAACGTTTGA AAAATGGTGA TGTGTGTGAA 
CTTGGCTTGC AAGCTCGCCC GCGTTGGCCG ATTGATCAGT TAACGTCAAT TCAGAAATAA

Protein sequence

MRIIGIETSC DETGIAIYDD EKGLLSHKLY SQVKLHADYG GVVPELASRD HVKKTIPLIK 
AAMAEANVTP QDLDGVAFTA GPGLVGALLV GATIGRSLAY AWDVPAVPVH HMEGHLLAPM 
LEENPPPFPF VALLVSGGHT MLVEVKNIGE YRILGESIDD AAGEAFDKTA KLMGLDYPGG 
PLLAKLAEKG TPGRFKFPRP MTDRPGLDMS FSGLKTFTAN TIAANGDDEQ TRADIAYAFQ 
EAVCDTLVIK CKRALEETGL KRVVIAGGVS ANKQLRADLE KLAKKIGGEV YYPRTEFCTD 
NGAMIAYAGM QRLKNGDVCE LGLQARPRWP IDQLTSIQK