Gene VC0395_A0907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0907
Symbol	mdoD
ID	5135468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	923029
End bp	924666
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	48%
IMG OID	640532365
Product	glucan biosynthesis protein D
Protein accession	YP_001216853
Protein GI	147675383
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3131] Periplasmic glucans biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000000201606
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGTG TGTCCAGCGC CGTGCAACGT CATGCGCAAA AACTGATTGT ACTTTTCTCC 
CTGCTGTTTG GGGCTTCTTT GCTGATGTCT GATAATGGTT TTGCTACAGA CATTAAAAAT 
ACTAATGCCT CTTCTCCAGT GAATTCAGAG TCTACTAAGC CAACAAAAGC TGGCGAAGTT 
AAAAATGTGG TTCGCTTTGC CAAAACGGGA TCGTTTGATA ACGACACCGT TGTTCGCCTA 
GCTCGCCAAC TGGCGAAAAA GCCTTATGTT GCCTTAAAAG ATCCGCTACC AGAGAGTTTG 
GCCAATATCA GTTATGATGA GTACCGCGAT ATTCGTTTTA AACCCGACAG TGCAGTGTGG 
AAAGCAGATG GCCTACCATA TCAAATGCAA CTATTCCATC GCGGTTTCTT CTTCCAAGAT 
CTGATTGAAA TTGCACTTGT TGAAGGCAAC CAAGCCACTC ACCTAAGTTA CGACCCCAAT 
ATGTTCACCG CTGGCGAAGT TCTACAACAG AACCTGCCGA CTGAAGATAT TGGTTATAGT 
GGTCTTCGTG TGCATTACCC TCTCAACAGC CCATCCTATT TTGATGAACT GTTTGTATTC 
CAAGGAGCAA GCTACTTCCG TGCTCTGGGT AAAGGCAATG CGTATGGCTT GTCTGCGCGT 
GGCTTGGCCA TCAAAACTGC CGATCCAGCG GGTGAAGAGT TCCCTATTTT CCGTGCCTTC 
TGGGTGGAAA AACCAAACTA CGACACCAAC TTGATTGTGG TCCATGCCCT ACTGGATAGC 
CCAAGCGTGT CTGGTGCGTA TCGTTTCTCT ATTCGTCCAG GAGAAAATAC TCGTATGGAC 
GTTGAGGCGG TACTCTTCCC ACGCGTGGAG TTAAGCAAAG TTGGTCTAGC TCCGGCAACC 
AGTATGTTCA TGCATTCGCC AAATGGCCGT GAGAAGACCG ATGATTTCCG TCCTTCTGTG 
CATGATTCTG ATGGTTTATT GATGATCAAC GGACGTGGTG AACGTTTGTG GCGTCCATTG 
GCTAACCCTA GCACACTGCA AGTGAGCGCC TTTATGGACA ACTCACCGCA AGGCTTTGGT 
TTGATGCAGC GTGAGCGCGA TTACGCCAAC TACCAAGATT TGGAAGCCCA TTACGAAAAA 
CGTCCAAGTC TGTGGGTTGA ACCGGTCGGT AACTGGGGTC CTGGTGCTGT CGTGTTGACA 
GAAATTCCAA CTCAATCAGA AATTCACGAC AACATTGTCG CCTTCTGGAA GCCAGCACAA 
CCTCTTGCAG CAGGCAGTGA ATATCGTTTC TCTTATCACC TCAACTGGGG TGCGCAACCA 
GAAGCGAATC CACAAGCGAT CACTGTAAGC CGTACTGCGA GTGGACGTGC CGATATTGCC 
AAACCAACGC CAAAACGTTT GTTCGTGATT GATTACCAAG TCCAAGGTGC CAAGCCTGCA 
CAGATGCCAG AACCGAAAGT GCGCAGCAAT GCTGGGGTAA TCAGTAACGT TGTACTGCGT 
GATAACCCTG CCAATAATGG CTATCGCCTC TCATTTGAAT TTGATCCAGG CGAAGTGACG 
CTGGCTGAAC TACGGGCAGA GCTCACTTTG CAAGAAGCGC GTCCTGTAGA AACTTGGTTG 
TATCGTTGGA CCCTGTAG

Protein sequence

MIRVSSAVQR HAQKLIVLFS LLFGASLLMS DNGFATDIKN TNASSPVNSE STKPTKAGEV 
KNVVRFAKTG SFDNDTVVRL ARQLAKKPYV ALKDPLPESL ANISYDEYRD IRFKPDSAVW 
KADGLPYQMQ LFHRGFFFQD LIEIALVEGN QATHLSYDPN MFTAGEVLQQ NLPTEDIGYS 
GLRVHYPLNS PSYFDELFVF QGASYFRALG KGNAYGLSAR GLAIKTADPA GEEFPIFRAF 
WVEKPNYDTN LIVVHALLDS PSVSGAYRFS IRPGENTRMD VEAVLFPRVE LSKVGLAPAT 
SMFMHSPNGR EKTDDFRPSV HDSDGLLMIN GRGERLWRPL ANPSTLQVSA FMDNSPQGFG 
LMQRERDYAN YQDLEAHYEK RPSLWVEPVG NWGPGAVVLT EIPTQSEIHD NIVAFWKPAQ 
PLAAGSEYRF SYHLNWGAQP EANPQAITVS RTASGRADIA KPTPKRLFVI DYQVQGAKPA 
QMPEPKVRSN AGVISNVVLR DNPANNGYRL SFEFDPGEVT LAELRAELTL QEARPVETWL 
YRWTL