Gene Gdia_1833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1833
Symbol
ID	6975255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2036264
End bp	2037898
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	68%
IMG OID	643391358
Product	malate dehydrogenase
Protein accession	YP_002276208
Protein GI	209543979
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.381517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGAC CCGCCCGACA TACCCTGCGG GGCACGGCAC TGCTGAACGA CCCGGCCTTC 
AACCGGGGAA CCGCCTTTAC GGCCGCGGAA CGGCAGACCT ACGGGCTGGA AGGCCTGCTG 
CCGCCGCAGA TCGAAACGCT GGAACGGCAG GCCGAGCGGG CTCTGCGTCA CCTGGACGCC 
AAGCCGACGG ATCTGGAACG CTATATCTAC CTCGCGGCCC TGGTCGACCG GAACGAGACC 
CTGTTCTACA AGGTGCTGAT GTCCGACCCG GCGCGCTTCG TGCCGATCGT CTACGCCCCC 
ACGCTGGGCG AGGCCTGCAA GGCATTCAGC CACATCTATC GCCGCCCCCG GGGCATGTAT 
ATCAGCCTGG AGATGAAGGG CCGCATCGCG GACATCCTGC GCAACTGGCC GGTGTCCGAC 
GTGCGCTTCA TCTGCGTCAC CACCGGCGGG CGCATCCTGG GCCTGGGCGA TATCGGCGCC 
AACGGCATGG GCATTCCCAT CGGCAAGCTG CAGCTCTACA CCGCCTGTGG CGCCGTGCCG 
CCGCAGGTCA CGCTGCCGAT CCAGCTGGAT ATCGGCACCA CCAACGCGGC GCTGCGGGCC 
GATCCGCTCT ATCTGGGCCT GCGGCACGAA CCCCCGCCGC AGGCCGAACT CGACGCCTTC 
GTCGAGGAAT TCGTGACGGC GGTGCAGGAG GTCTTTCCCG CCTGCTGCAT CCATTTCGAG 
GACTGGAAGG GCACGGACGC GATCCGCTAC CTGGAGCGCT ACCGGGAGCG GGTGCTGTGC 
TACAACGACG ACATCCAGGG CACGGCGTCG GTGACGCTGG CCGGGCTGGT CACGGCGCTG 
CGGATCAAGG GCGAAAAACT GTCCGACCAG ACGGTGCTGT TCCTGGGTGC CGGGTCGTCC 
GCGCTGGGCA CGTCGGACCT TCTGGTCAAG GCGATGCAGG CCGAAGGCCT GTCGCAGGCC 
GACGCCCGCG CCCGCATCAC CATGATGGAC GTCAAGGGGC TGGTCGAACC CTCGCGCACC 
GACCTGTCCG AGGAACAGCG GCGTTACGCC CATGCGGCGG AGCCCACGCG CGACCTGATG 
GCCACCATCC GCCGCGTGCG GCCCAGCGTG CTGATCGGCG TGTCCACCGT GGGCGGCGCC 
TTCACGCAGC CGGTCGTCGA ACTGATGGCC GCGATCAATG CGCGGCCGAT CATCTTTCCG 
CTGTCGATCC CGCATTCGGA ATGCTCGGCC GAACAGGCCT ATGCCTGGTC CGACGGCCGG 
GCGCTGTACG CGGCCGGGGT CCAGTTCCCG CAGGTCATGC GCGACGACCA TGTCTTCCGC 
CCCGGGCAGG CCAATAATTT CTACATCTTC CCCGGGCTGG GGCTGGCGGT CTATGCGACG 
CGTCCGCGCC TGATCCCCGA CGCGCTGATC ATCGAGGCCG CACACGCCCT GGCCGACCAG 
GTCGACGTGA CGGCGCAGGC GCGCGGCATG CTGTATCCGC CGCAGAACCA GATTCTCGAG 
GTCCAGGTCA CGTCGGCCTG CCGCCTTGCG GAATATCTCT TCGATGCCGG GCTGGCCACC 
GTGCCGCGTC CGGACGATAT CCGGTCTTGG ATCGAGGGCA TGACCTACAG CCCGACCTAC 
GCGCCGGACG CCTGA

Protein sequence

MNRPARHTLR GTALLNDPAF NRGTAFTAAE RQTYGLEGLL PPQIETLERQ AERALRHLDA 
KPTDLERYIY LAALVDRNET LFYKVLMSDP ARFVPIVYAP TLGEACKAFS HIYRRPRGMY 
ISLEMKGRIA DILRNWPVSD VRFICVTTGG RILGLGDIGA NGMGIPIGKL QLYTACGAVP 
PQVTLPIQLD IGTTNAALRA DPLYLGLRHE PPPQAELDAF VEEFVTAVQE VFPACCIHFE 
DWKGTDAIRY LERYRERVLC YNDDIQGTAS VTLAGLVTAL RIKGEKLSDQ TVLFLGAGSS 
ALGTSDLLVK AMQAEGLSQA DARARITMMD VKGLVEPSRT DLSEEQRRYA HAAEPTRDLM 
ATIRRVRPSV LIGVSTVGGA FTQPVVELMA AINARPIIFP LSIPHSECSA EQAYAWSDGR 
ALYAAGVQFP QVMRDDHVFR PGQANNFYIF PGLGLAVYAT RPRLIPDALI IEAAHALADQ 
VDVTAQARGM LYPPQNQILE VQVTSACRLA EYLFDAGLAT VPRPDDIRSW IEGMTYSPTY 
APDA