Gene Apre_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1104
Symbol
ID	8397891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1181133
End bp	1182152
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	39%
IMG OID	644995451
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_003152852
Protein GI	257066596
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAC TAACTTATAA GGATAGCGGA GTCGATAAGG AAAAAGGCTA TAAGGAAGTT 
GAATTAATCA AAAAAATCGT AAAAGAAACA CATAGTAAAG AAGTCCTAAC AGATATAGGA 
GGCTTTGCTG GGGCCTTTGC CCCAGATCTT ACAGGAATTG ATAATCCAGT TTTCCTAAGC 
GGAACAGATG GGGTTGGGAC AAAGATTAAA CTTGCTATGG AGATGGATAA GCACGATACA 
GTAGGGATTG ATTGTGTAGC CATGTGTGTC AATGACATCC TCTGCCAGGG AGGAAGGCCC 
CTATTTTTCC TAGATTATAT AGCGACTGGT AAGCTTAATC CAGAAAAAAT GGCAAAGCTT 
GTCGAAGGAG TTGCAAGAGG ATGTAAAGAA GCTTCAGCAA GTCTAATAGG TGGAGAGACT 
GCCGAGATGC CAGGTATCTA TAAGGAAGAT GATTATGACC TGGCAGGCTT TGCTGTAGGA 
ATTTGTGATA GGGATAAGTT AATTGATGGG AAAAGTCTAA AAGAAGGAGA TATAGCCATA 
GGACTTTACT CATCAGGAGT TCACAGCAAC GGCTTTTCTC TAGTAAGGGC CAGCATGGAA 
CAAGGAGGAG TCTCACTAGA TGATAGATTT AGTGAAGAAG AAAGTATTGG AGAAAAACTC 
CTAAGACCTA CCAAAATCTA TGCTAAAGAA ATCAAATCCT TACAAGAAAA TATTGATCTA 
AAAGCAATCG CCCATATAAC AGGAGGAGGT TTTTATGAAA ATGTCCCTAG AGTTTTAGGA 
GATGAGTTGG GAGTAGACTT CGACCTAAGT AGGCTCAATC TCGATCCAAT CTTTACTAAG 
ATTCAAGAAT GGGGCAACAT AGATACGGAT GAAATGTATC ATACCTTCAA TATGGGAGTA 
GGAATGGTAG TATTTGTAGA CGAGAATGAC AAAGATTTGG CCCTAGACCT CCTAGAAGGC 
AAGGCTCAAG TAATTGGTAA AGTAAGAAGC GGTAATAAGG ATATCAAAAT TAATTTATAA

Protein sequence

MAKLTYKDSG VDKEKGYKEV ELIKKIVKET HSKEVLTDIG GFAGAFAPDL TGIDNPVFLS 
GTDGVGTKIK LAMEMDKHDT VGIDCVAMCV NDILCQGGRP LFFLDYIATG KLNPEKMAKL 
VEGVARGCKE ASASLIGGET AEMPGIYKED DYDLAGFAVG ICDRDKLIDG KSLKEGDIAI 
GLYSSGVHSN GFSLVRASME QGGVSLDDRF SEEESIGEKL LRPTKIYAKE IKSLQENIDL 
KAIAHITGGG FYENVPRVLG DELGVDFDLS RLNLDPIFTK IQEWGNIDTD EMYHTFNMGV 
GMVVFVDEND KDLALDLLEG KAQVIGKVRS GNKDIKINL