Gene VC0395_A2649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A2649
Symbol
ID	5136451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	2802136
End bp	2803194
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	53%
IMG OID	640534097
Product	hypothetical protein
Protein accession	YP_001218527
Protein GI	147674782
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCTGC TTGCGATATA TATCTCTGTC GCGATTGGCG TATCGTTTAT CTGTTCAGTT 
TTAGAAGCGG TACTCTTAAG TATTACCCCA AGCTATCTAG CCCAGTTGCG CCAACAAGGC 
AACCCTGCGG CTAATCGCCT AGCAGGCCTA AAGGCGGACA TCGACCGCCC ACTCGCCTCG 
ATTCTGACCC TCAATACCAT TGCGCACACC ATAGGTGCTG CGACGGCTGG CGCACAAGCG 
GCGGTGGTGT TTGGTAGCCA GTGGCTTGGC CTGTTCTCTG CTGTGCTCAC CCTAGGCATT 
CTGGTGCTGT CGGAAATCGT GCCCAAAACC ATAGGTGCGA CCTACTGGCG TGAACTCGCT 
CCCCAAGCTT CTCTCGTGCT GCGTTGGATG GTATGGGCGC TGACGCCGTT CGTCTGGTTC 
TCAGAGCAGA TCACTAAGCG CCTCGCGCGC AAAGTTGAAG CGCCAAAGCT ACGTGACGAG 
ATCTCCGCGA TGGCGATGTT GGCCAATGAA AACGGTGAGT TTGCAGAAGG CGAATCAAAA 
ATGCTGAACA ACTTACTGGC GATTCAAAAT GTGCCAGTAA CGCAAGTTAT GACGCCGCGC 
CCGGTACTGT TTCGCGTTTC CGCGGATCTA ACGATTGATG AATTTATCGA GCAGCACCGC 
GATACGCCGT TCTCGCGCCC GCTGATTTAC AGCGAAGAGA AAGACAACAT TGTCGGCTTT 
GTGCACCGCC TTGAGTTGTT TAAAGAGCAG CAAAATGGCC AAGGAAACTT GCTACTGGGT 
GATGTGATGC GCCCAATCCA TGTGGTGCTC AACACCTTGA GCTTACCAAA AGCCTTCGAC 
CAGATGATGC AAAAGCGCTT GCAACTGTCA GTCGTGGTAG ACGAATACGG CTCAGTGCAG 
GGTTTGCTTA CCTTAGAAGA CATCTTCGAG CACTTGCTCG GCGAAGAGAT TATCGATGAA 
GCCGACCGCA CAACCGATAT GCAGCAACTA GCCACCGAAC GCTGGGAGCA CTGGAAGCGC 
CAGCATCGCA TGATCGAAAG CCGCGACGAA GTGGAATAA

Protein sequence

MFLLAIYISV AIGVSFICSV LEAVLLSITP SYLAQLRQQG NPAANRLAGL KADIDRPLAS 
ILTLNTIAHT IGAATAGAQA AVVFGSQWLG LFSAVLTLGI LVLSEIVPKT IGATYWRELA 
PQASLVLRWM VWALTPFVWF SEQITKRLAR KVEAPKLRDE ISAMAMLANE NGEFAEGESK 
MLNNLLAIQN VPVTQVMTPR PVLFRVSADL TIDEFIEQHR DTPFSRPLIY SEEKDNIVGF 
VHRLELFKEQ QNGQGNLLLG DVMRPIHVVL NTLSLPKAFD QMMQKRLQLS VVVDEYGSVQ 
GLLTLEDIFE HLLGEEIIDE ADRTTDMQQL ATERWEHWKR QHRMIESRDE VE