Gene Apar_0818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0818
Symbol
ID	8413683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	899639
End bp	900697
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	42%
IMG OID	645022400
Product	Aldose 1-epimerase
Protein accession	YP_003179838
Protein GI	257784621
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.376675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.120929
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATG TTAGGCCTTT TGATAGTTTT GTTAACTCTC CCGCTGCTCT TACTTATACT 
ATTCGAGGCG CTCATTCAGC AATTAAATTA AGTAATTTTG GCGCCACTAT TCTTGACATT 
TCAGTACCAG ATGTCTATGG AACACAAGCA GATGTAGTTC TTGGATATGG CCTGTTTGAC 
CTGTATTTAG ATAATCCTGC TTGCTTTGGT GCCTCCATTG GACCTTCTGC AAATCGTGCG 
GATAAAGCAG AGATTCCACT TAATGGAGTT GTCTATCATC TTCCTAAAAA CAATGGTCCA 
AATAATCAAA ATAATCTTCA CACTGATTTA GTTGATGGTA TTCATAAGCG CATTTGGCAA 
GCAGAAATCG ATGAATCACA TAATACCGTG ACATTCAGCA TTGACCTGAT AGATGGAGAA 
TATGGACTAC CAGGTAACCG CCATATCACC GCTACATATG AGCTTGTTGA AGAATCTGCA 
CAGTCAACGG TAAATCTTAC GTATGCCTGT ACTACTGATG CTGCAACATT CGTAAACATG 
ACCAACCACG TGTACTTTAA CCTCAACGGT CACGATTCCG GAGATGTCTG CGGTCACCAA 
CTCACTATCC AGGCAGAATC ATACCTTCCT CTACGAGAAG ATTCAGTTTC TGCAGGAATC 
GTAAACTCTG TTGCAGGAAC TCCTTTTGAT TTCCGTACAC CTAAGGCCAT TGGAAAAGAT 
CTTGGTGTTG AAAACGAGCA GCTTAAAATT GCTCACGGCT ATGATCATTG CTTTGTAATT 
AACAATTACA AAAATGGTCA GCTTCGCCCC GCTCTTCTCG CCACTTCAGA AGGCGGTCGA 
TCTCTTGAAA TTCAAATCAC CGCTCCCGGT GCTCATCTAT ATACTGGCAA CTGGCTTGAT 
GAGGCACGCG CAAAAGACGG TGCTATCTAC AAACCTCAAG CTGGCTTTGC ATTTGAAAGC 
GAATTTTATC CAGACTGTGC TCACCATGCA GAGTGGCCTC AGCCTATTTG CACACCTGAG 
CATCCTTACA ACTCACAAAT TGTTTATCGA TTCTTTTAA

Protein sequence

MIDVRPFDSF VNSPAALTYT IRGAHSAIKL SNFGATILDI SVPDVYGTQA DVVLGYGLFD 
LYLDNPACFG ASIGPSANRA DKAEIPLNGV VYHLPKNNGP NNQNNLHTDL VDGIHKRIWQ 
AEIDESHNTV TFSIDLIDGE YGLPGNRHIT ATYELVEESA QSTVNLTYAC TTDAATFVNM 
TNHVYFNLNG HDSGDVCGHQ LTIQAESYLP LREDSVSAGI VNSVAGTPFD FRTPKAIGKD 
LGVENEQLKI AHGYDHCFVI NNYKNGQLRP ALLATSEGGR SLEIQITAPG AHLYTGNWLD 
EARAKDGAIY KPQAGFAFES EFYPDCAHHA EWPQPICTPE HPYNSQIVYR FF