Gene VC0395_0301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_0301
Symbol
ID	5134133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	-
Start bp	334908
End bp	335933
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	48%
IMG OID	640530624
Product	hypothetical protein
Protein accession	YP_001215142
Protein GI	147672292
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGTGT CGAGTGCGTT TTTTCAATCT TGTCTTCCTA TCGCTCGCAA TGTCTTTTTA 
GAGATAGTTG TAATTATAAA GACCTGCCAC ACTATAACCC AAGGAACAAA TTGCGACGAG 
GCGCACATGA TCTATCTTCT GCCATTTTTT ACTGTGCTGA TTTGGGGTGG CAACTCGATT 
GTCAATAAAC TCGCGGCCTC GACCATCGAA CCTAGTGCGA TGAGCTTTTA TCGCTGGCTA 
TTGGCTATGG CGATCCTCAC TCCTTTCTGT CTACCTAGCG CTATCCGCCA ATGGTCAACG 
GTGAAACGCC ACTTGAGTAA ACTCGCATTT TTGGCTTTAC TCGGCATGGT GCTTAACCAA 
TCCCTAGGCT ACTACGCGGG GCTCACCACC ACGGCGACCA ATATGTCACT CATCACTTCT 
TTTGTTCCTT TAATGAGTGT TTTCATTAGC TTGCCGTTAC TTAACAAACC CATCTCAGCC 
CTTAGCGTGG TGGGTGGCGT ACTGTCGCTG AGCGGGCTTG CCTACATGCT CGGAGAAGGA 
AATCCGCTGT TTTTCCTCCA TCAAAGCGTG ACCGAAGGGG ATGCCTTAAT GGTGATGGCA 
GCACTGGTGT ACGCCTTGTA CTGCGTGCTT TTGAAACGCT GGAAAATGCC GTTTAGCAAC 
TGGACTTTAA TTTATCTGCA AGGGGTATGC GCCGTATTCA TGCTGATCCC TTTATGGCTC 
ACCAGCGATA CGCTATTACC GACCGAAGGT TCACTCTCTC TGATCGCTTA TGCTGGCATT 
GCTGCTTCTC TATTAGCACC TTGGATGTGG GTAAAAGCCA TTGATGCGAT TGGCGCAGAC 
TCCACCGCCA TGTTTATGAA TCTGCTACCC GTTTTTTCTG TTTCTTTGGC CGCCACTTTA 
TTGGGCGAAA AAGTTCATCC CTACCATTTA ATTGGTGATC TATTAGTCAT CAGCGGTGTC 
GCGCTGTCAC AATTGAAAAT TCAACGTCGA AACGATGACG GCGTCGAAAA AGTGACGCAG 
GTATAA

Protein sequence

MQVSSAFFQS CLPIARNVFL EIVVIIKTCH TITQGTNCDE AHMIYLLPFF TVLIWGGNSI 
VNKLAASTIE PSAMSFYRWL LAMAILTPFC LPSAIRQWST VKRHLSKLAF LALLGMVLNQ 
SLGYYAGLTT TATNMSLITS FVPLMSVFIS LPLLNKPISA LSVVGGVLSL SGLAYMLGEG 
NPLFFLHQSV TEGDALMVMA ALVYALYCVL LKRWKMPFSN WTLIYLQGVC AVFMLIPLWL 
TSDTLLPTEG SLSLIAYAGI AASLLAPWMW VKAIDAIGAD STAMFMNLLP VFSVSLAATL 
LGEKVHPYHL IGDLLVISGV ALSQLKIQRR NDDGVEKVTQ V