Gene VC0395_A2254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A2254
Symbol
ID	5135711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	2402209
End bp	2403486
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	51%
IMG OID	640533710
Product	putative malate dehydrogenase
Protein accession	YP_001218170
Protein GI	147675732
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.966162
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGATG ACAATCGCCT CAACCCAACA CCTGAAGAAC AATTTCGCCA ACGCGCTCTG 
GATTACCATG CTTACCCAAC CGCGGGCAAA ATTGGTATTG CACTGACCAA GCCAGCCGAT 
TCTGCTGCCG ATCTCGCTCT GGCTTATAGC CCAGGTGTAG CTGAGCCAGT GCGTGAAATC 
GCGCAAAACG TTGACAATGT GTATAAGTAC ACCGCGAAAG GCAACACGGT GGCCGTGATC 
TCTAACGGCA CCGCAATTTT AGGATTGGGA AATTTAGGCC CGATGGCCTC TAAGCCTGTC 
ATGGAAGGTA AGGCACTGCT GTTTAAACGC TTCGCAGGAT TGGATTCGAT TGATATTGAA 
GTAAAACACC GCACGATCGA CGAATTTATC GATACTGTCG CTAACATTGC TGATACTTTC 
GGCGGTATCA ACTTAGAAGA TATCAAAGCC CCAGACTGCT TTGAAATTGA GCGCCGCCTG 
ATTGAGCGTT GTGATGTCCC TGTATTCCAC GATGACCAAC ACGGTACTGC GATTGTCACC 
GCGGCTGGTA TGCTTAATGC GCTTGAGTTG CAAGGTAAAC AACTGAAAGA CTGTATTATC 
GTCTGCCTTG GTGCGGGTGC CGCAGCAGTG GCGTGTATGG AGCTACTGAT CAAATGCGGG 
GCAATGCGTG AGAAAATCTA CATGCTGGAT CGCAAAGGCG TGATCCACAC TCGCCGTGAT 
GATCTCAATG AATACAAAGC ACTGTTTGCC AACAACACCG ACAAGCGTAC GTTGGAAGAT 
GTGATTGCGG GAGCGGATCT GTTCCTCGGC GTTTCTGGCC CTAACTTGCT GCCAGCGGAT 
GCCCTTAAGC TGATGGCCGA CAAGCCTGTG GTGTTTGCCT GCTCCAACCC AGATCCTGAA 
ATCAAGCCAG AAATTGCTCA TCAAGTGCGT AACGACATGA TCATGGGGAC TGGTCGCAGC 
GACTATCCAA ACCAAGTTAA CAACGTGCTC TGTTTCCCGT TCATTTTCCG TGGAGCACTC 
GATGTGCGCG CGAGTGAAAT CAATGACCAG ATGAAACTGG CTGCAGTAGA GGCGATTCGC 
CAACTGGCGA AAGAGCCTGT GCCAGCCGAA GTGCTGGCAG CTGCTGGAGT GGATAAGCTC 
AGTTTCGGTA TTGATTACAT CATTCCAAAA CCGATGGACC CTCGCCTATT GCCACGCGTA 
GCACGCGCCG TCGCGGAAGC GGCAGTGGAA TCAGGTGTTG CTCGTATCCC AATGCCAGAA 
AACTACATGC AGGCTTAA

Protein sequence

MSDDNRLNPT PEEQFRQRAL DYHAYPTAGK IGIALTKPAD SAADLALAYS PGVAEPVREI 
AQNVDNVYKY TAKGNTVAVI SNGTAILGLG NLGPMASKPV MEGKALLFKR FAGLDSIDIE 
VKHRTIDEFI DTVANIADTF GGINLEDIKA PDCFEIERRL IERCDVPVFH DDQHGTAIVT 
AAGMLNALEL QGKQLKDCII VCLGAGAAAV ACMELLIKCG AMREKIYMLD RKGVIHTRRD 
DLNEYKALFA NNTDKRTLED VIAGADLFLG VSGPNLLPAD ALKLMADKPV VFACSNPDPE 
IKPEIAHQVR NDMIMGTGRS DYPNQVNNVL CFPFIFRGAL DVRASEINDQ MKLAAVEAIR 
QLAKEPVPAE VLAAAGVDKL SFGIDYIIPK PMDPRLLPRV ARAVAEAAVE SGVARIPMPE 
NYMQA