Gene VC0395_0423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_0423
Symbol
ID	5134909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	-
Start bp	468183
End bp	469640
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	50%
IMG OID	640530746
Product	N-acetylglucosamine-binding protein A
Protein accession	YP_001215264
Protein GI	147672074
COG category	[S] Function unknown
COG ID	[COG3397] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.0208095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC AACCTAAAAT GACCGCTATC GCCCTGATCC TCTCTGGTAT CAGTGGATTA 
GCGTATGGAC ACGGCTACGT TTCCGCAGTG GAAAACGGTG TCGCCGAAGG ACGTGTCACC 
TTGTGTAAAT TTGCCGCTAA CGGCACTGGA GAAAAAAACA CTCACTGTGG CGCGATTCAA 
TACGAACCAC AAAGTGTCGA AGGCCCAGAT GGCTTCCCGG TCACTGGCCC TCGCGATGGC 
AAAATTGCCA GTGCGGAATC GGCACTGGCG GCAGCGCTGG ATGAGCAAAC CGCCGACCGT 
TGGGTAAAGC GCCCAATTCA AGCTGGCCCG CAAACCTTCG AGTGGACGTT TACCGCCAAC 
CACGTCACAA AGGATTGGAA ATACTACATT ACCAAACCAA ACTGGAACCC AAACCAGCCA 
TTGTCGCGTG ATGCATTTGA CCTCAATCCG TTCTGTGTCG TTGAAGGAAA TATGGTGCAG 
CCACCAAAAC GTGTCAGCCA CGAATGTATC GTGCCTGAGC GCGAAGGGTA TCAGGTCATC 
CTCGCCGTAT GGGATGTGGG CGATACCGCA GCTTCCTTCT ACAACGTGAT CGACGTGAAA 
TTTGACGGTA ACGGCCCAGT GTTACCGGAT TGGAACCCAG CAGGTCAAAT CATTCCAAGT 
ATGGATCTCA GCATTGGCGA TACCGTGTAC ACTCGCGTGT TTGATAACGA GGGGGAAAAC 
CCCGCTTATC GCACTGAGCT GAAAATTGAC TCTGAGACGC TAACCAAAGC CAATCAATGG 
TCTTACGCTC TGGCGACTAA AATTAACCAA ACGCAAAAAC AGCAACGTGC TGGTCAGCTT 
AATGGCGATC AATTTGTTCC CGTTTACGGC ACCAACCCGA TTTATCTGAA AGAAGGCAGT 
GGCTTGAAGA GTGTTGAAAT TGGCTACCAA ATTGAAGCGC CACAGCCTGA GTATTCACTG 
ACGGTTTCTG GTCTAGCGAA AGAGTATGAG ATTGGCGAAC AACCGATTCA GCTTGACCTG 
ACTTTAGAAG CGCAAGGTGA AATGAGCGCA GAGCTGACGG TTTATAACCA CCACCAAAAG 
CCGCTGGCAA GTTGGTCACA AGCGATGACG GATGGCGAGC TGAAATCAGT AACCTTAGAA 
CTGAGTGAAG CCAAAGCTGG ACACCACATG CTGGTTTCTC GCATCAAAGA TCGCGATGGC 
AATCTGCAAG ATCAACAAAC TCTCGATTTC ATGCTGGTTG AACCGCAAAC ACCACCAACA 
CCGGGTGACT ACGACTTTGT TTTCCCGAAT GGCCTGAAAG AGTACGTGGC TGGCACCAAA 
GTGCTCGCTA GTGATGGCGC AATCTACCAA TGTAAGCCAT GGCCATACTC TGGCTACTGC 
CAGCAATGGA CAAGTAACGC TACTCAATAC CAACCGGGTA CCGGCAGTCA TTGGGAAATG 
GCGTGGGATA AACGTTAA

Protein sequence

MKKQPKMTAI ALILSGISGL AYGHGYVSAV ENGVAEGRVT LCKFAANGTG EKNTHCGAIQ 
YEPQSVEGPD GFPVTGPRDG KIASAESALA AALDEQTADR WVKRPIQAGP QTFEWTFTAN 
HVTKDWKYYI TKPNWNPNQP LSRDAFDLNP FCVVEGNMVQ PPKRVSHECI VPEREGYQVI 
LAVWDVGDTA ASFYNVIDVK FDGNGPVLPD WNPAGQIIPS MDLSIGDTVY TRVFDNEGEN 
PAYRTELKID SETLTKANQW SYALATKINQ TQKQQRAGQL NGDQFVPVYG TNPIYLKEGS 
GLKSVEIGYQ IEAPQPEYSL TVSGLAKEYE IGEQPIQLDL TLEAQGEMSA ELTVYNHHQK 
PLASWSQAMT DGELKSVTLE LSEAKAGHHM LVSRIKDRDG NLQDQQTLDF MLVEPQTPPT 
PGDYDFVFPN GLKEYVAGTK VLASDGAIYQ CKPWPYSGYC QQWTSNATQY QPGTGSHWEM 
AWDKR