Gene Apar_1191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1191
Symbol
ID	8414069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	1333903
End bp	1335537
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	52%
IMG OID	645022785
Product	malate dehydrogenase
Protein accession	YP_003180210
Protein GI	257784993
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.16614
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0761619
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGG GTTTTGAACT ACTGAACGAT CCCTTCCTCA ACAAAGGAAC CGCTTTTTCG 
CAGGAGGAAC GACAGAAGTA TGGTCTGGTA GGTCTTTTAC CTCCAAACAT TCAGACCATC 
GAGGAGCAAG CAGAGCAGGC ATATGTGCTT TTCCAGCAGT ATCCTGACCT CGAGACTAAG 
CGTCACTACC TGATGAGGCT TTTCTCCGAA AACCGCACGC TTTTCTATAA CCTGTTCTCA 
AAGCACGTCG AAGAGTTCAT GCCTATCGTC TACGATCCAA CCATTGCACC TGACATTGAA 
CAGTACTCCC TGCGCTACGT TGACTCGCAG TACGCATGCT TCCTATCCGC TGATCACCCT 
GAGGACCTTG AAACTTCGCT GAAGGACGCA GCCGCAGGTA GAGACATTGA CCTGATTGTC 
GTTACCGACG CAGAGGCCAT TCTGGGCATT GGTGACTGGG GCACCAACGG TGTCGAAATT 
TCCGTCGGCA AGCTCATGGT TTACACCGCT GCAGCTGGCG TTGATCCAAA CCGCATCATG 
CCTGTTGTCA TTGACGCAGG CACCAACCGC CAGGAGTTGC TCGATAACCC TCTCTACCTG 
GGCGAGCGTC ACAAGCGCGT TGATGAGGAC CGCTACAACG CCTTCATTGA TAACTTTGTA 
ACCACCGTGG AGCAGCTCTT CCCTAACCTC TACCTGCACT TTGAGGACTT CGGACGCTCA 
CACGCTGCAG CAATCCTGGA CCGCTACAAA AACACCTACC CCGTCTTTAA CGACGACGTC 
GAGGGCACTG GCATTGTTAC CCTCGCAGGC ATCCTCGGCG GCCTCAACAT TTCTGGCGAG 
AAACTCGTTG ACCAGGTATA TCTCTGCTTT GGCGCAGGAA CCGCCGGTTG CGGCATTGCT 
GAGCGCGTAC TACAAGAGTT TGTGGACCAG GGAATGGATC GCGAGGAGGC TCGCAAGCGC 
TTCTACCTGG TAGATCGCCA GGGCCTGCTC TTCGACGACA TGGACAACCT TACTCCACAG 
CAAAAGCCCT TTGCTCGCAA GCGCTCAGAA TTTGCAAACG CTGATGAGCT CACTAACCTT 
GCAGCTGTTG TAAAGACGGT CCATCCAACA ATCATGGTTG GCACCTCTAC CGTTCACGGT 
GCCTTCACCG AGGAGATTAT TAGCGAGATG GCAGCTCATT GTAAGCGCCC AATGGTCTTC 
CCTCTATCCA ACCCAACTAA ACTTGCAGAG GCAGCCGCTC AGGACCTGCT GACCTGGACT 
GATGGTCGCG CGCTTGTAGC ATGCGGTGTC CCATCCGATG ATGTTGAGCT CAACGGTATA 
ACCTACCAGA TTGGCCAGGC CAACAACGCT TTAATCTATC CGGGTCTTGG ACTTGGCGTT 
CTTGCATCAA AAGCTCGCCT ACTCACAGAC CAAATGATTT CGCTGGCAGC TCACTCACTT 
GGCGGAATTG TTGACACCAC AAAGCCTGGT GCTGCAATTC TTCCTCCAGT CTCCAAGATT 
ACTGAGTTCT CTGAGCGTAT TGCCATTGGT GTTGCAGAGG AAGCAATCAA GCAAGGTCTA 
AACCGCAAAC CAATCGCTAA TGCAAAAGAG GCAGTTGATG CCCTCAAGTG GTTCCCTGTC 
TACAAAGAAC TCTAA

Protein sequence

MKTGFELLND PFLNKGTAFS QEERQKYGLV GLLPPNIQTI EEQAEQAYVL FQQYPDLETK 
RHYLMRLFSE NRTLFYNLFS KHVEEFMPIV YDPTIAPDIE QYSLRYVDSQ YACFLSADHP 
EDLETSLKDA AAGRDIDLIV VTDAEAILGI GDWGTNGVEI SVGKLMVYTA AAGVDPNRIM 
PVVIDAGTNR QELLDNPLYL GERHKRVDED RYNAFIDNFV TTVEQLFPNL YLHFEDFGRS 
HAAAILDRYK NTYPVFNDDV EGTGIVTLAG ILGGLNISGE KLVDQVYLCF GAGTAGCGIA 
ERVLQEFVDQ GMDREEARKR FYLVDRQGLL FDDMDNLTPQ QKPFARKRSE FANADELTNL 
AAVVKTVHPT IMVGTSTVHG AFTEEIISEM AAHCKRPMVF PLSNPTKLAE AAAQDLLTWT 
DGRALVACGV PSDDVELNGI TYQIGQANNA LIYPGLGLGV LASKARLLTD QMISLAAHSL 
GGIVDTTKPG AAILPPVSKI TEFSERIAIG VAEEAIKQGL NRKPIANAKE AVDALKWFPV 
YKEL