Gene Apar_1330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1330
Symbol
ID	8414215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1496311
End bp	1497900
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	45%
IMG OID	645022927
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_003180345
Protein GI	257785128
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00539756
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000346935
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCTGAGG CCCCTATCAA ACGTGCGCTA ATTTCGGTAA CAGATAAAAC GGGTATTGTT 
GAATTTGCAC AAACTCTTAC TAAAGAGTTT GGTGTTGAAG TAATTTCAAC AGGTGGAACC 
GCAAAAACCC TTGAAGAGGC TGGTGTCCCC GTAGTTCCTA TTGAGTCTTA TACCGGATTT 
CCAGAAATGA TGGACGGTCG TGTTAAGACG CTGCATCCTC GTGTTCATGG TGGTCTTTTA 
TGCCGTAGAG ATAATTCCGG TCATGTCGCA GACGCAGAGA ATAATGGTAT TGGCATGATT 
GACCTGGTCT GCGTTAATCT CTATGAGTTT GAGAAGACTG TAGCTGATCC ATCAGTAACT 
CTTGAAAATG CAATTGAGCA TATCGATATC GGTGGACCTT CAATGCTCCG CTCTGCTGCA 
AAGAATAATG ATTTTGTTAC GGTTGTTGTT GATCCGGCAG ATTATGGTCG TGTTCTTGAT 
GAGATGCGTG TCCATGACGG TGCAACTACA AGGGCTTCTC GCCAGCAGCT GGCTTTGAAG 
GTATTTAAGA CAACGGCTGC ATACGATGGC GCTATTGCCG CATACCTTTC TGGTGTTGTT 
GAAGCAGAGC AAAGTAAATT CCCAGAGACT TTGCTGGTAA AGGCAACAAA GGAGCAAGAT 
CTTCGTTACG GAGAAAATCC TCAGCAGTCC GCAGCGTTTT ACAAGATGCC TGGCGCTCCT 
GCACACTCCC TAGCAAATGC TCAGCAACTT CAGGGTAAGC CTTTGTCTTA CAACAATTTG 
TTGGATACCG ATGCAGCTTG GGCGGCTGTT CGTGAGTTTG ATGATCCATC AGTCATTATT 
TTGAAGCATC AGAATCCTTG TGGTTCTGCA ACAGCAGAAA ATGTTATTGA GGCATATGAC 
CGGGCATTTG CTTGTGATCC TCTTTCTGCA TTTGGTGGAA TTATTGCAGT GAACAGAGAA 
GTTCCACTGG AGTTTGTGGA GCATTTTGCA GATATCAATA AGCAGTTTGT TGAGGTTCTT 
ATTGCATCAA GTTTCACGGA AGAGGCTCTT GAGCGACTGT CAAAGAGAAC AAATCTTCGC 
GTATTAGCTA CGGGCGGAAT CGATAGAAGT CGTGAGCTCG AAATGAGAAC TGTTGATGGT 
GGTCTTTTAG TGCAAGACCT TGATCATGCT GATGAAACTG CGGATAGCTT TGAGGTTGTC 
ACAAAGCGTC AACCAACTTC AGAAGAGTTG TCTGATTTGG TATTTGCTTG GAAGGTCTGT 
AAGACCGTTA AGTCTAATGC AATTCTGGTC GCAAAAGATC AGGCTGGAAT TGGTATGGGA 
CCAGGTCAGC CCAACCGTGT TGATGCTGCT CTTCTCGCAT GTGAGCGTGC TGAAGCAGCT 
TGCGAGCGTA TGGGAATTGA TTCAAAGAAC CTTGTGGCTG CATCTGACGC ATTCTTCCCA 
TTCCGAGATA ACGTTGACAC GCTGGCAGCT CATGGCGTAA CAGCTATTAT TCAGCCAGGT 
GGATCAGTTA GAGACGATGA ATCCATTGCT GCTTGTGATG AATATGGTAT TGCAATGGTG 
TTTACGGGAA AGCGACACTT TAGGCACTAA

Protein sequence

MAEAPIKRAL ISVTDKTGIV EFAQTLTKEF GVEVISTGGT AKTLEEAGVP VVPIESYTGF 
PEMMDGRVKT LHPRVHGGLL CRRDNSGHVA DAENNGIGMI DLVCVNLYEF EKTVADPSVT 
LENAIEHIDI GGPSMLRSAA KNNDFVTVVV DPADYGRVLD EMRVHDGATT RASRQQLALK 
VFKTTAAYDG AIAAYLSGVV EAEQSKFPET LLVKATKEQD LRYGENPQQS AAFYKMPGAP 
AHSLANAQQL QGKPLSYNNL LDTDAAWAAV REFDDPSVII LKHQNPCGSA TAENVIEAYD 
RAFACDPLSA FGGIIAVNRE VPLEFVEHFA DINKQFVEVL IASSFTEEAL ERLSKRTNLR 
VLATGGIDRS RELEMRTVDG GLLVQDLDHA DETADSFEVV TKRQPTSEEL SDLVFAWKVC 
KTVKSNAILV AKDQAGIGMG PGQPNRVDAA LLACERAEAA CERMGIDSKN LVAASDAFFP 
FRDNVDTLAA HGVTAIIQPG GSVRDDESIA ACDEYGIAMV FTGKRHFRH