Gene VIBHAR_01041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VIBHAR_01041
Symbol
ID	5556143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio harveyi ATCC BAA-1116
Kingdom	Bacteria
Replicon accession	NC_009783
Strand	+
Start bp	1049896
End bp	1051530
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	48%
IMG OID	640906535
Product	malate synthase
Protein accession	YP_001444261
Protein GI	156973354
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTATGC TTGCTCAGAC AGAACAAAAA ACACAACAAC TAAAGCAAAC CCAAGGCATG 
CTTGAGGTGA ATGGAGTCGT TGCTCCTGAA CATCAAGCAA TTTTCCCTGT TGAAGCCCAA 
ACCTTTTTAT CTCTACTGTG TGAAAAATTT GCCGAACGTG TTGAACAGTT GCTGGAAGCA 
CGAGAAGAGA AGCAAGCACG CATCGACGCT GGTGAACTGC CAGACTTTCT ACCAGAGACA 
CAAGACATTC GTGAAGGAAG CTGGAAGATC CTTGGAATCC CGCAAGATCT GCAAGATCGC 
CGAGTGGAAA TCACTGGACC AACCGATCGC AAGATGGTGA TTAACGCACT GAATGCGAAT 
GTAAAAGTGT TCATGGCCGA TTTCGAAGAT TCGATGTCCC CTGCGTGGAG TAAAGTTCTG 
GATGGTCAAA TCAACCTGCG CGACGCTGTT AATGGCACCA TCAGCTACAG CAATCCTGGC 
AATGGCAAGC ACTATCAGCT GGCAGAAGAC CCAGCGGTGT TGATCTGCCG TGTTCGCGGA 
CTGCATCTAA AAGAAAAACA CGTAACGTGG CACGGTCAGA TCATTCCAGG TGCGCTATTC 
GATTTCGCTC TGTACTTCTA CAACAACTAC AAAGCGCTAC TGAAAAAGGG AAGCGGTCCT 
TACTTCTACA TTCCAAAACT GCAATCGCAT CATGAAGCTA AGTGGTGGAG CGAAGTGCTC 
CATTTCACCG AAGAATATTT CGGTTTGGAT ACTGGCACCA TCAAAGCGAC TGTACTGATT 
GAAACCTTAC CAGCCGTATT CGAAATGGAT GAGATTCTGT TCTCTCTGAA AGAGCACATC 
GTTGGTTTGA ACTGTGGTCG CTGGGATTAC ATCTTTAGCT ACATCAAAAC ACTGAAAAAC 
CACCCAGATC GCGTACTTCC GGATCGCCAA GTGGTGACCA TGGATAAGCC ATTCCTCAAC 
GCTTACTCAA GATTGTTGGT GCGAACTTGT CATAAACGTG ACGCATTTGC GATGGGCGGC 
ATGGCAGCCT TTATTCCGGC TAAAGACCCA CAAGAAAACC AAAAAGTGCT GGATAAGATC 
CACAACGATA AATCACTAGA AGCCAACAAC GGTCATGACG GCACTTGGGT TGCTCACCCT 
GGTTTGGCAG ACACCGCAAT GGAAGTGTTC AGTGCCACAC TGGGGCAGCG CACTAACCAA 
TTGGATGTGA GCCGCTCAGA AGACGCACCA ATCACCGCCG CAGAGCTGCT TGAACCTTAC 
GAGGGTGAAC GCTCAGAAGA AGGTATGCGC CACAACATCC GCGTTGCGCT GCAATACATC 
GAAGCGTGGA TCTCTGGCAA TGGTTGTGTG CCGATTTACG GGCTGATGGA AGACGCTGCA 
ACGGCAGAAA TCTCCCGTGC TTCTATTTGG CAATGGATTC AACACGGTAA GTCGCTCGAC 
AACGGATTGA AGGTCACTAA AGAGCTGTTC GAACTCTATC TGAAAGAAGA GATTGAAGTC 
GTGGAGCAAG AAATTGGCGA GCAGCGTTAC CAAGCAGGTC GATTTGAAGA AGCGGCAGAT 
TTGATGGCTA GGCTCATCAC AAGCGATGAA CTGACCAACT TTTTAACCAT TCCAGGTTAC 
GACTACTTGG ATTAA

Protein sequence

MIMLAQTEQK TQQLKQTQGM LEVNGVVAPE HQAIFPVEAQ TFLSLLCEKF AERVEQLLEA 
REEKQARIDA GELPDFLPET QDIREGSWKI LGIPQDLQDR RVEITGPTDR KMVINALNAN 
VKVFMADFED SMSPAWSKVL DGQINLRDAV NGTISYSNPG NGKHYQLAED PAVLICRVRG 
LHLKEKHVTW HGQIIPGALF DFALYFYNNY KALLKKGSGP YFYIPKLQSH HEAKWWSEVL 
HFTEEYFGLD TGTIKATVLI ETLPAVFEMD EILFSLKEHI VGLNCGRWDY IFSYIKTLKN 
HPDRVLPDRQ VVTMDKPFLN AYSRLLVRTC HKRDAFAMGG MAAFIPAKDP QENQKVLDKI 
HNDKSLEANN GHDGTWVAHP GLADTAMEVF SATLGQRTNQ LDVSRSEDAP ITAAELLEPY 
EGERSEEGMR HNIRVALQYI EAWISGNGCV PIYGLMEDAA TAEISRASIW QWIQHGKSLD 
NGLKVTKELF ELYLKEEIEV VEQEIGEQRY QAGRFEEAAD LMARLITSDE LTNFLTIPGY 
DYLD