Gene Apar_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1049
Symbol
ID	8413922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1188705
End bp	1189853
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	46%
IMG OID	645022638
Product	glucose-1-phosphate adenylyltransferase
Protein accession	YP_003180068
Protein GI	257784851
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0448] ADP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR02091] glucose-1-phosphate adenylyltransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAA AAGAATGTCT TGCAATGCTG CTTGCAGGGG GACAGGGAAG CCGTCTAGGC 
GCTCTAACCT CAAAAGTAGC TAAGCCAGCT GTTTCGTTTG GCGGCAAGTT CCGCATCATT 
GACTTTGCAT TATCCAACTG CGCAAATTCA GGAATTTCTA CGGTGGGTGT TTTGACACAG 
TATCGTCCGT ATTTGTTGCA CTCTTATGTG GGGTCAGGTA GTGCTTGGGA CCTTGATGAG 
CTTGGCGGTG GAATTTCTAT TCTTCCTCCA TTTGCTACTC AGTCTGGTGG TGCATGGTAT 
GCGGGCACTG CAGATGCTGT CACTCAGAAT ATTGGTTACA TCGAGCAGAA CAAACCTGAT 
TACGTAATTA TCCTCTCTGG CGATCAGCTC TATCGTATGG ACTACGGTGA GATGCTTGCT 
TGCCATAAAG ACAATAATGC CGACCTCACT ATTGCTGTTA TGCCTGTTCC TTGGGAGGAA 
GCTTCCCGCT TTGGCATTAT GTCTGTTGAT GATGAAGGTA GAATCACTAA GTTTTCCGAG 
AAACCCGCAG AACCTGAGTC CAATCTAGCT TCTATGGGCA TCTATATCTT CACCACTGAT 
TTGCTTCTTG AAACACTCCG TGAAGATGCA AAGAATCCTG AGTCTTCTCA TGATTTTGGT 
AAAGATATTA TTCCAACGCT GCTTGACGAT GGTAAGCGCC TGTTTACCTA TCGCTTTGAG 
GGCTTCTGGC GTGATGTGGG TACTATTGCA AGTTATCATG AGACCAGTAT GGACCTGCTT 
GGCTCCGAGC CTAAGTTTGA TATTTTTTCG GACAAGTTCC CCATTTTGTC TAATGCTTCT 
ACCCGTCCAC CAGCGTATAT TGGCCCTTTT GGTGAGGTAG ACGATTGTCT AGTAAGCAAC 
GGCTGTCAAG TCTTTGGCTA TTCTCGCCAT TCAATTTTGT CTACAGATGC CGTTGTTGGT 
GAGGGAGCAC GTGTTATTGA CTCTGTGCTT CTTCCTGGCG CAGAGGTTAA GCCTGGTGCC 
GTTGTGATTC GCGCAATTAT TGGTGAGAAC GCCGTGGTCG AGAAGAACGT TCACGTTGGT 
AGTTCTGATT TAAACAAAGA GATTGCTGTT GTTGGAAATG ATGTAGTGGT TGAAAGAGGT 
GAGCACTAA

Protein sequence

MSKKECLAML LAGGQGSRLG ALTSKVAKPA VSFGGKFRII DFALSNCANS GISTVGVLTQ 
YRPYLLHSYV GSGSAWDLDE LGGGISILPP FATQSGGAWY AGTADAVTQN IGYIEQNKPD 
YVIILSGDQL YRMDYGEMLA CHKDNNADLT IAVMPVPWEE ASRFGIMSVD DEGRITKFSE 
KPAEPESNLA SMGIYIFTTD LLLETLREDA KNPESSHDFG KDIIPTLLDD GKRLFTYRFE 
GFWRDVGTIA SYHETSMDLL GSEPKFDIFS DKFPILSNAS TRPPAYIGPF GEVDDCLVSN 
GCQVFGYSRH SILSTDAVVG EGARVIDSVL LPGAEVKPGA VVIRAIIGEN AVVEKNVHVG 
SSDLNKEIAV VGNDVVVERG EH