Gene VC0395_0398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_0398
Symbol
ID	5134894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	+
Start bp	441983
End bp	443296
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	48%
IMG OID	640530721
Product	hypothetical protein
Protein accession	YP_001215239
Protein GI	147671939
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.596861
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTTT TCGAAAACAT CTCGATCATC ATGGCGCTGA TTGCTGCCAG TTGTTTCTTT 
TCTATGTCAG AAATTTCTTT GGCTGCGGCG CGCAAAATTC GTTTGCGGCA GATGGCCGAT 
GAAGGCGATG AACGTGCCGA GCGGGTGTTA GAGCTGCAAG CTCGGCCAGG CAACTTTTTC 
ACTGTGGTGC AAATTGGCCT CAATGCGGTT GCCATTATGG GCGGTATTGT GGGGGAATCG 
GCGTTTACCC CTTACATCCG AGCGCTGCTG GAAGGATGGA TTCCAGCCAA TCTCCTGTCA 
CAAGCGAGTT TTGTGCTCTC CTTTATGCTC GTAACCAGTA TGTTTATTTT GATTGCGGAT 
TTGATGCCTA AGCGGATTGC GATGGCGATG CCAGAGCGAA TTGCCACCAG TTTGGTGGGA 
GGCATGCTGA TTTGCATTAC TTTGTTAAAA CCGTTTGTTT GGTTCTTCAA TGGATTGGCG 
AACTTGCTGT TTCGCGCTCT CAGTGTACCG ACCGAGCGTA ATGATGAGAT CACCTCTGAC 
GACATTTATG CCGTGATGGA TGCTGGCGCA GAAGCGGGCG TGCTGGATAA AGGCGAGCAA 
CAGATGATGG AAAGCGTGTT TGAAATGCAG AGCATTCCAG TGACATCGGC CATGACGGCG 
CGCGAAAGTT TGGTGTTTCT TAACCTCAGC GACAGTGAGG AAGTGATCAA GCAGAAAATT 
TCTCAGCATC CGCACAACAA ATTCTTGGTC TGTGATGGGC AGTTGGATCA GATCAAAGGT 
TACGTTGACT CGAAGGCCTT GTTAATTCGA GTAATTAATG GTCAAGGAAT GAATCTCAAA 
GAGAGCAATG TGGTCATTGG TTGTCCGATT ATTCCCGATA CGTTAAGCCT TTCGGAAGCG 
TTGGAGTACT TCAAAATTAA CCGCGTTGAT TTTGCGGTGG TGATGAACGA ATACGCGCTT 
GTTGTAGGCG TTGTGACGTT CAACGACTTA CAAAGCGCAG TCATGGGCAC TTGGGTGCTT 
GCCGAAGGGG AAGAGCAAAT CGTCGCGCGT GATGGCAACT CATGGCTAGT AGACGGGGTG 
ACACCGATCA CCGACGTGAT GCGCTCCTTT GCGATTGAAG AGTTTCCTCA GCAACAAAAC 
TACGAAACGA TCGCAGGATT TATGATGTAT ATGCTGCGTA AGATCCCGCG TCGTACGGAT 
TCAGTGGTCT ATGCCGGCTA TAAATTTGAA GTGGTGGACA TCGATAATTA CAAAGTCGAT 
CAGCTTCTGG TGAGTCGCGT TGAACCTCTC GAACCTATCG TCAAAGAAGA ATAG

Protein sequence

MSFFENISII MALIAASCFF SMSEISLAAA RKIRLRQMAD EGDERAERVL ELQARPGNFF 
TVVQIGLNAV AIMGGIVGES AFTPYIRALL EGWIPANLLS QASFVLSFML VTSMFILIAD 
LMPKRIAMAM PERIATSLVG GMLICITLLK PFVWFFNGLA NLLFRALSVP TERNDEITSD 
DIYAVMDAGA EAGVLDKGEQ QMMESVFEMQ SIPVTSAMTA RESLVFLNLS DSEEVIKQKI 
SQHPHNKFLV CDGQLDQIKG YVDSKALLIR VINGQGMNLK ESNVVIGCPI IPDTLSLSEA 
LEYFKINRVD FAVVMNEYAL VVGVVTFNDL QSAVMGTWVL AEGEEQIVAR DGNSWLVDGV 
TPITDVMRSF AIEEFPQQQN YETIAGFMMY MLRKIPRRTD SVVYAGYKFE VVDIDNYKVD 
QLLVSRVEPL EPIVKEE