Gene VC0395_A0450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0450
Symbol
ID	5137767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	478651
End bp	479748
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	47%
IMG OID	640531908
Product	putative polysaccharide biosynthesis protein
Protein accession	YP_001216401
Protein GI	147673812
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTACCATC AAGGATGTAC AGTGAGAAAA AACATTAATC TAATGATCGC CACAGATCTG 
AAAGGACAAG GTGGTGTGGC AACAGTGGTC TCAACCTACG CTGATTGTGG TTTTCTAGAA 
GAAAACCACA TCAAGTTGAT TGCCTCACAC TCAAGTTTGG ACCACGGGCA GAAATGGCGA 
ATGACATTGC GCTTTATGCT TGCACTCTGC CAATTGTTGT ACTGCTTTAT GCGTTACCGA 
GTCGGCATAG TACATATTCA CATGTCATCA AGGGGAAGCT ATCGACGTAA GTCTGTGATT 
ATTCGTCTAG TTAAGCTTTT GAAAGGAAAG GTTATTCTGC ACTTACATGG CGCCGAGTTT 
CGTGATTTCT ATCGAGATGA GTGCAATATG GTTCAGCAAA GGCATATTCG ACACACTTTT 
GCTTTGGCGG ATCATGTGCT GGTTCTTTCA ACTCAATGGC TCGCATGGCT ACAAGAGGTC 
ATAGGTAGAA CACAAGGCGT TTCTGTTCTG TATAACGCCG TACCCAGTTT GGCTTTAGAT 
CGCCACCTTG CTCAACCTGG CCGTATTGCC TTCCTTGGTC GTTTGGGGAC GCGCAAAGGA 
GTCGGTGATT TGATTCAAGC CTTTGCGTTA GTTAAGCAGC GCTGCCCAGA AGCACAGCTG 
TATCTTGCTG GCGATGGTGA GATTGAAACC TATCAAGCGA TGGCTGAGCA GCTTGGCTTG 
AACGGGTCCG TTCACTGTTT AGGCTGGATA GCTGGCGAAG CTAAGCTCAA ATTATTGACC 
CAAACTGATA TTTACTGCTT ACCCAGTTAT AACGAAGGTT TTCCTATGGG CGTTATAGAA 
GCTATGTCGG CAGGGATTCC CGTCGTCGCA AGTCGAGCGG GCGGAATTCC TGATGCGATC 
AGTGATGGTG AGCAAGGTCG TTTAATTGAG GCCGGTGATG TGGTTGCTTT AGCGCAAGCA 
CTCGGAGATC TGATTGAACA GCGTGCCGAA AATCAACGTA TTGCGACCGC GGCGAAGCAA 
AAGTTTGCTG AAAACTTCTC TTTGCAAGCG GTGATCCCGC GTCTACAAAC ACTTTACGAT 
GAGCTTTTAA AATCATGA

Protein sequence

MYHQGCTVRK NINLMIATDL KGQGGVATVV STYADCGFLE ENHIKLIASH SSLDHGQKWR 
MTLRFMLALC QLLYCFMRYR VGIVHIHMSS RGSYRRKSVI IRLVKLLKGK VILHLHGAEF 
RDFYRDECNM VQQRHIRHTF ALADHVLVLS TQWLAWLQEV IGRTQGVSVL YNAVPSLALD 
RHLAQPGRIA FLGRLGTRKG VGDLIQAFAL VKQRCPEAQL YLAGDGEIET YQAMAEQLGL 
NGSVHCLGWI AGEAKLKLLT QTDIYCLPSY NEGFPMGVIE AMSAGIPVVA SRAGGIPDAI 
SDGEQGRLIE AGDVVALAQA LGDLIEQRAE NQRIATAAKQ KFAENFSLQA VIPRLQTLYD 
ELLKS