Gene VC0395_A0647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0647
Symbol	gsk-1
ID	5135622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	687552
End bp	688856
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	43%
IMG OID	640532105
Product	inosine-guanosine kinase
Protein accession	YP_001216597
Protein GI	147675110
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.243174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTC CTGGCCAACG CAAATCTAAG CATTATTTTC CGGTTCACGC GCGTGATCCT 
CTGGTCATTC AAGCGCAAGA AAATAAGAAG ATGTCGCGCA CCCACATTAT CGGTATTGAT 
CAAACCCTAG TGGATATTGA GGCCAAAGTC GATTCAGATT TGATTGAACG TTATGGTTTA 
AGTAAAGGAC ACTCATTGGT CATTGATGAT CATGCTGCAG AAGCGTTATA CAACGAATTA 
AAAGAGCAGC GTTTGATTAC CAATGAATAT GCAGGTGGAA CCATAGGGAA TACGCTGCAT 
AATTACTCCG TGCTTGCGGA TGATCGCTCC ACGCTACTGG GTGTGATGAG CCAAGATATT 
AAAATTGGCA GTTACGGTTA TCGCTATCTG TGTAACACTT CTAGCCGCAT GGATCTCAAC 
TATCTGCAAG GTGTAGATGG CGCGATTGGC CGCTGCTTTG CCTTAATTAC CGAAGATGGT 
GAACGTACTT TCGCGATCAG CGAAGGTCAA ATGAACCAAT TACGCCCAGA CAGTATTCCT 
GAAAAAATAT TTGCTAGTGC CTCTGCATTA GTGATCACGG CTTATTTAGT TCGTTGTAAA 
GAAGGCGATC CAATGCCGGA AGCAACAATG CGTGCCATTG AATATGCCAA AAAATATGAT 
GTGCCTGTGG TATTAACCCT AGGTACTAAA TTTGTTATTC AAGATGATCC GAAATTCTGG 
CAAGAATTTT TACGTGATCA TGTCACTGTG GTGGCAATGA ATGAAGATGA AGCATTAGCT 
TTAACAGGAG AAAGCGATCC GCTCGCAGCC TCAGATAAAG CGTTAGATTG GGTTGATTTA 
GTACTGTGTA CTGCAGGCCC AGTCGGTTTA TTTATGGCGG GTTACACCGA AGATTCCGCT 
AAACGTGAAA CGTCATTACC GTTATTACCG GGATCGGTCC CAGAATTTAA CCGCTATGAA 
TTTAGCCGCC CTGCCCGTAA AGAGAGTTGT ATAAATCCTA TTCGTGTTTA TTCACATATT 
TCACCGTATA TAGGCGGTCC AGAGAAGATA AAAAATACCA ATGGTGCTGG AGACGCAGCA 
TTATCCGCTC TACTGCATGA TATGGCGGCT AATAAATACC ATAAAGAAAA CGTCCCTAAC 
TCAAGTAAGC ATCAACATGA GTTTTTAACC TATTCTTCTT TCTCTCAAGT TTGCAAATAC 
TCTAACCGTG CAAGTTATGA AGTATTGGCG CAGCACTCAC CACGTCTTTC ACGTGGTCTT 
CCTGAGCGAG AAGATAGCCT TGAAGAGGCT TATTGGGAAA GATAA

Protein sequence

MKFPGQRKSK HYFPVHARDP LVIQAQENKK MSRTHIIGID QTLVDIEAKV DSDLIERYGL 
SKGHSLVIDD HAAEALYNEL KEQRLITNEY AGGTIGNTLH NYSVLADDRS TLLGVMSQDI 
KIGSYGYRYL CNTSSRMDLN YLQGVDGAIG RCFALITEDG ERTFAISEGQ MNQLRPDSIP 
EKIFASASAL VITAYLVRCK EGDPMPEATM RAIEYAKKYD VPVVLTLGTK FVIQDDPKFW 
QEFLRDHVTV VAMNEDEALA LTGESDPLAA SDKALDWVDL VLCTAGPVGL FMAGYTEDSA 
KRETSLPLLP GSVPEFNRYE FSRPARKESC INPIRVYSHI SPYIGGPEKI KNTNGAGDAA 
LSALLHDMAA NKYHKENVPN SSKHQHEFLT YSSFSQVCKY SNRASYEVLA QHSPRLSRGL 
PEREDSLEEA YWER