Gene VC0395_A0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0040
Symbol
ID	5135348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	37417
End bp	38496
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	50%
IMG OID	640531500
Product	putative extracellular solute-binding protein
Protein accession	YP_001216014
Protein GI	147675633
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAATCA CAACCTATTT AAATAAAAGC CGCATCATGC TGGCCCTTGT CCTGAGCACA 
GTTTTAGGAA CCGCGCAGGC CAACGAACCA CCCGTTTATA AACTGACGCT GGCCGAAACG 
TGGGGGGCGA ATACTCCTAT CCTCGGCGAT GCACCAAAAA ACATGGCGAA ATTGGCCGCT 
GAAATGTCCA ATGGCCGCAT TCAAATCCGT ATCGACTCGG CCAACAAACA CAAAGCACCG 
CTGGGCGTGT TTGATATGGT GAAATCCGGT CAATACGATC TCGGTCACTC CAGCTCTTAT 
TATTGGAAAG GCAAGGTTCC GAATACCCTC TTTTTCTCTT CGATGCCGTT TGGCATGATC 
GCAACTGAGC AATACGCTTG GTTCTATTAT GGCGGCGGGA TGCCGTTGAT GGAGAAGGTG 
TACGCGCCGC ATAACCTCTT GTCGTTTCCG GGCGGTAACT CAGATATTCA AATGGGCGGA 
TGGTTTAAAA AAGAGATCAA CAGCGTTGAC GATCTGCAAG GGCTGAAAAT GCGTATTCCG 
GGATTTGCGG GTGAAGTGTT GGCAAAACTT GGCGCGAAAC CCACGAACAT TGCACCGGGG 
GAGCTTTATA CCTCGCTAGA ACGCGGCACC ATCGACGCAC TGGAATGGGT TGGCCCAGCC 
TTTGATCTGC GCATGGGCTT TCATAAAATT GCCCCTTATT ACTACACCGC ATGGCATGAA 
CCGGGCTCCG AAACGCAATT TTTAGTCAAT AAGAAGAAGT GGGATACGCT ACCAAAAGAC 
ATCCAAGTGA TCTTAGAAAC CGCTTTCCGC GTCGCCGCTT TCGATATGTA CAACCAAGCG 
ATCGATGCGA ATGCGACGAG CTGGGCAGCG ATGAAAAGTG AGTACCCAGA CATCAAAGTT 
CGTGATTTTC CACCCGCAGT ACTTGCCGCA CTACGCCAAG CCAACAATGA ACTTCTGCAA 
GAGCAGGCAG CAAGCGATCC GCTCGCTAAA GAGATCATCG ACTCTCAGCA GGCTTACTTA 
ACCAAAGTGC GTGATTGGAC TCGGATCTCG ACACAAGCGT ACTTAAATAC CAATCCTTAA

Protein sequence

MPITTYLNKS RIMLALVLST VLGTAQANEP PVYKLTLAET WGANTPILGD APKNMAKLAA 
EMSNGRIQIR IDSANKHKAP LGVFDMVKSG QYDLGHSSSY YWKGKVPNTL FFSSMPFGMI 
ATEQYAWFYY GGGMPLMEKV YAPHNLLSFP GGNSDIQMGG WFKKEINSVD DLQGLKMRIP 
GFAGEVLAKL GAKPTNIAPG ELYTSLERGT IDALEWVGPA FDLRMGFHKI APYYYTAWHE 
PGSETQFLVN KKKWDTLPKD IQVILETAFR VAAFDMYNQA IDANATSWAA MKSEYPDIKV 
RDFPPAVLAA LRQANNELLQ EQAASDPLAK EIIDSQQAYL TKVRDWTRIS TQAYLNTNP