Gene Apar_0456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0456
Symbol
ID	8413305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	524276
End bp	525658
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	44%
IMG OID	645022024
Product	protein of unknown function UPF0118
Protein accession	YP_003179478
Protein GI	257784261
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.204189
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAAA AGCATCAAAA CTTTTCCGAT TCGATTCAGA GTTGGAAACA GCGTGGCCTG 
ATGGTATGGA CAGCCATTGG CTTTGCTGCG TTGTTTGCAC TTGCACTGTA TGTCCTTGGT 
ATTTTGGGGC AGGCCGTTGA GTTGTTGGCT ATTGGCGCTA TTGTTGCGTT TGTGTGCAGT 
CCTGTAACTA ACTGGCTTGA AGATAGGGGA ATACCTCGCG GTATTTCTGC TTTTGCAGCA 
CTTATTCTTA CACTTATTGT GTTTGTAGGA TTTTTGATTT TGATTGCTCA ACCATTGGTG 
CTTGAGCTTA CCACGCTGCT TAAGAATGCT CCTTCGTATG CAAGCCAGAT AGGAGCAATG 
GCTAGGGAAT TTTGGCAGAA CTTTGACTCT CAGAGTAACC CAGCTGTTAG ACAGACGGTA 
GAGCTTGTAA TTGAGCGGGC ATCGAGCATT GGAATATCAG TTGCTTCTGG CATTTTAAGT 
TGGCTTTCAA CATCTGCTTT AGGCAATATT TCATCTATGG CAAACCAGCT TATGGTCTTT 
TTCTTGGGTC TAGTGCTTGC CTATTGGCTT GCCAAAGATT ATCCCGTTAT TGTTCGTGAG 
CTGGCTATTA TTGCAGGTCC TCAAAAAGAG GATGAGTTCA GACTTATTCT TGCAATCTTA 
AGCAGATCTA CCAGTGGATA TATGCGTGGA ACTATCATTA CCTCTGCAGT TAACGGCATT 
CTTGTGTACT TTGGTTGCCT TATTTTAGGT AACCCTTATG CTGCCCTCAT TGGTATGGTC 
ACAGGAATCT TCCACATTAT TCCTGTGGTT GGACCGGTTT TCTCGGCAGG CATTGCTCTG 
ATTCTGAGTA TTTTGGTAGA CCCCATCATG ACCGTGTGGA CCATCGTTAT CTTGATGGTT 
GCTCAAAACG TTGTGGATAA TGTGCTTTCA CCTTTGGTTA TGGCAACTAG CGTCAAAGTC 
CATCCGGGTC TTTCACTTAT AGGCATTGTT ATTGGTAGCG CTCTTGGCGG AGTAGTCGGA 
ACCATTCTTG CAATTCCACT GACTGCAGCA CTTAGAGGTA TTTTTGTGTA CTTCTTTGAG 
AAGTACTCGG GCAGACAGAT TGTCTCACCA AATGGTGCGC TCTTTAATTC CACGCAGTAT 
GTGGATGAGA AAGGCGCTAT TTTGCCAGAG TATGATGCAC TGGACGATCC AAAGTTTTTT 
GAGGAGTCAC GTCTTGTTGA TCAAGACACT ACGGCTCATA TTCGTAGTAA GTCTTCAATT 
CCTGCGCCAA AGATTCTTGG GCATGATTTT TCTCAGTTAC TTTTTAGGAA TACTCAAGAA 
GTTATTAAAG AACCAGATAA ACCATCGTCA GATACGGTAG ACTCAGACAG TACAAAAGAG 
TAG

Protein sequence

MDQKHQNFSD SIQSWKQRGL MVWTAIGFAA LFALALYVLG ILGQAVELLA IGAIVAFVCS 
PVTNWLEDRG IPRGISAFAA LILTLIVFVG FLILIAQPLV LELTTLLKNA PSYASQIGAM 
AREFWQNFDS QSNPAVRQTV ELVIERASSI GISVASGILS WLSTSALGNI SSMANQLMVF 
FLGLVLAYWL AKDYPVIVRE LAIIAGPQKE DEFRLILAIL SRSTSGYMRG TIITSAVNGI 
LVYFGCLILG NPYAALIGMV TGIFHIIPVV GPVFSAGIAL ILSILVDPIM TVWTIVILMV 
AQNVVDNVLS PLVMATSVKV HPGLSLIGIV IGSALGGVVG TILAIPLTAA LRGIFVYFFE 
KYSGRQIVSP NGALFNSTQY VDEKGAILPE YDALDDPKFF EESRLVDQDT TAHIRSKSSI 
PAPKILGHDF SQLLFRNTQE VIKEPDKPSS DTVDSDSTKE