Gene Apre_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0037
Symbol
ID	8396784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	44943
End bp	46118
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	38%
IMG OID	644994374
Product	phosphopentomutase
Protein accession	YP_003151813
Protein GI	257065557
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000700156
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AAAAGAGAGT ATTTTTAATA GTTTTAGACT CTGTGGGCAT AGGCGAAATG 
CCAGATGCTC ACAAATATGG CGATGAGGGT AGCAATACCC TTGCTGCTAT TGTTAAAAGC 
GATAAATTTA AGGCAGATAA TTTAGCAAAA CTTGGATTTT TCAATATCGA AGGTGTTGAT 
TGCAAGGAAG ATGTATTAAA TCCTATAGGA TCTTTTGCAA GACTTGCCGA AGCTTCAAAT 
GGCAAGGACA CAACTACAGG TCATTGGGAG ATGGCAGGCA TCATTTCAGA AAAACCTTTC 
CCTACCTTCC CAAATGGTTT TCCAGAAGAT TTTCTAGAAG AGTATTCTAA AAGAGTTGGT 
AGAAAGATTA TCTGCAACAA GCCATATTCT GGAACAGAGG TTATTGAAGA TTATGGTAAG 
GAACACTTGG AAACAGGAGC TCTTATAGTC TATACATCAG CAGACTCAGT CTTTCAGGTA 
GCAGGCCACG AAGATGTAGT TAGCCTTGAA GAATTATATC GCTGTTGTGA GATTGCAAGA 
GATATGCTTC AGGGAGATTT GGCAGTAGGT AGGGTTATAG CAAGGCCTTT TGTAGGCGAG 
CTTGGTTCTT TTGAGAGAAC TAGAAACAGA CACGACTACG CCCTAACTCC AACAGGCCCA 
ATCATTATGG ATGATTTGGT AAAAAATGGC TATGACTCTA TAGGAGTTGG CAAGATTTAT 
GATATCTTCG CAGGGCAGTC AGTCCTTGAA ACTTACAAGA TGGAAGACAA CATCGATGGA 
ATGAATATAA CCCTTGATTT GTGTGATAAG GATTTCAATG GCTTGTGCTT CGTAAATTTA 
GTTGATTTTG ACATGATTTA TGGTCATAGA AATGATGTAG ATGGTTATGC CAAGGCCTTT 
GCTGATTTTG ATAAGCAATT GGGAGAGATG CTTCCTAAAC TTAGGGAAGA TGACATTGTA 
ATTATCACAG CAGATCATGG ATGTGACCCA TCAACCCCAT CCACCGACCA CTCCAGGGAA 
TATGTTCCAA TGTTAATTTT TGGAGATAAG ATTAAATCTG GAGTTGACCT AAAGACAAGA 
AATACTTTTG CAGATATTGG AAAGACTATT GCCGATATAT TTGAAATCGA CTCAGCAATT 
CCAGGCGAAA GTTTTTATGA AAAAGTTAAA AAATAG

Protein sequence

MKNKKRVFLI VLDSVGIGEM PDAHKYGDEG SNTLAAIVKS DKFKADNLAK LGFFNIEGVD 
CKEDVLNPIG SFARLAEASN GKDTTTGHWE MAGIISEKPF PTFPNGFPED FLEEYSKRVG 
RKIICNKPYS GTEVIEDYGK EHLETGALIV YTSADSVFQV AGHEDVVSLE ELYRCCEIAR 
DMLQGDLAVG RVIARPFVGE LGSFERTRNR HDYALTPTGP IIMDDLVKNG YDSIGVGKIY 
DIFAGQSVLE TYKMEDNIDG MNITLDLCDK DFNGLCFVNL VDFDMIYGHR NDVDGYAKAF 
ADFDKQLGEM LPKLREDDIV IITADHGCDP STPSTDHSRE YVPMLIFGDK IKSGVDLKTR 
NTFADIGKTI ADIFEIDSAI PGESFYEKVK K