Gene Apar_0799 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0799
Symbol
ID	8413664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	880218
End bp	881465
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	43%
IMG OID	645022381
Product	oxygen-independent coproporphyrinogen III oxidase
Protein accession	YP_003179819
Protein GI	257784602
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTCCT GGCAGTTTAA ATATAATCAA GCGGCTGTTT CTGCACTTTA CCTGCATATC 
CCATTTTGCT CGCAAAAATG TTTCTATTGC GATTTTTCTT CTTGGTCTAC AAGACAAGAT 
GACAGTCGTA TGAAAAAGTA TGTAAATGCT TTAAAACATC AGTTAGACGA AGCTGCTCAA 
CTGGGTATAC TCGCAACTAC AAAAACAGTT TATATGGGCG GTGGAACTCC CAGCTTACTT 
GATCAGGGTG CGGTTGATCT GGCGCATCAT ACCTCATCTA TTACACATCC TATTGAATTT 
AGTATGGAAG CAAATCCAGA CTCACTATCT GACGAACTTC TCGCTAGTCT TTCTGCAGGA 
GGAGTAACGA GAATTTCTTT GGGAGTTCAG AGCTTTAATG ATAATGAGCT TAAGGAGCTT 
GGTAGAATTC ATTCAGCTGA TCTGGCATAC GATAGAGTTT TAGCTGCAAA AGAGAGCGGC 
TACGAAGTGT CGGTTGATCT CATGTGCGCT ATTCCTGAGC AAACAGAGAG TTCTTGGGAA 
TATACGCTTT CAAGGTTTAT CTCGCTTGGG GTAAATCATG TGAGTGTTTA TCCACTTACC 
ATTGAAGATG GCACGGCACT AGCTAAGCAA ACCCAAGATA AAGACATTCC ATGGAATGTT 
TATGACGTGC AGGCAGATCG AATGCAAACG GCTTCAAAGA TGCTTCAAGC AGCAGGATTT 
GAGCGTTACG AGGTGGCAAG TTATGCTCGT AATCAGAAAA GTTGCAAGCA TAATAAGATG 
TACTGGACAG GTGAGTCGTA TCTTGGTCTA GGTACTAGTG CTGCAAGTAT GTTGACAGCT 
TTTGAGTATG ATGCTCTGGC AAAGGAAAAC GCTTTTTTGC CTTCGAGACC ACAAGATGCT 
ATCCGTGTGC GACTTGTGGT GCTTGATTCT CCAAAAAAAA TTGCTGAAGG CATATCGCTT 
TTCTCGACAG AGTTTGACGT TGAATTTTTG ACCTACAGAG AAGCTGTGGC AGAAGATTTG 
ATGCTCCATG CACGCCTCAC AGAGCTAATT GCGCCTGCGC TTTTGGATGA GTCTGAGCAG 
GTATTTGGTG CATTAACTTT ACAAGAAGTG TTTGATGCCT GTGTACAAGA TGAGTTACTA 
GAATGCGTTG ATGCAGCAGA TTCTGAGATT AAGGCTTCAT ATAGGCCTAC CAAGAAGGGC 
TGGCTGCTTG GAAACGAGCT TTATGGCCGT TTTTGGGAGT TAAGATAA

Protein sequence

MNSWQFKYNQ AAVSALYLHI PFCSQKCFYC DFSSWSTRQD DSRMKKYVNA LKHQLDEAAQ 
LGILATTKTV YMGGGTPSLL DQGAVDLAHH TSSITHPIEF SMEANPDSLS DELLASLSAG 
GVTRISLGVQ SFNDNELKEL GRIHSADLAY DRVLAAKESG YEVSVDLMCA IPEQTESSWE 
YTLSRFISLG VNHVSVYPLT IEDGTALAKQ TQDKDIPWNV YDVQADRMQT ASKMLQAAGF 
ERYEVASYAR NQKSCKHNKM YWTGESYLGL GTSAASMLTA FEYDALAKEN AFLPSRPQDA 
IRVRLVVLDS PKKIAEGISL FSTEFDVEFL TYREAVAEDL MLHARLTELI APALLDESEQ 
VFGALTLQEV FDACVQDELL ECVDAADSEI KASYRPTKKG WLLGNELYGR FWELR