Gene Apre_0411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0411
Symbol
ID	8397185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	466894
End bp	468102
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	36%
IMG OID	644994769
Product	protein of unknown function UPF0118
Protein accession	YP_003152181
Protein GI	257065925
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAC TAGATAAAAA ATCTAGAGAT TTATTAAAGG TTATTTGTTA TGGTATTATA 
TTATTTTTTG CCTTCTGGTA TTTTCCAGTT ATAAAAGATG GCCTCGCTAG GGTAGTTGGA 
GTCTTCCAGC CCTTTATCAT AGGAGGGATG ATTGCTTATC TAGTGAGTAT TCCTATGAAT 
TATTTTGAAA GAAAACTCAG AGCAAACTTC CCAGATAAGA AGTATAGGAA AAGGATAAGT 
GCATTATCTT TATTTGTATC ATGGGTACTT ATTATATGTT GCTTGATTTT ATTTTTAAAC 
ATCCTGATTC CAAGGATTGT TGCAGTCATC TTCTCCTTCT TCAATAGGTG GCCTGAGTTT 
ATTAGAGAAA CTTACGAGAC TTTGAACAGT CACGCTATAA CAAGGCCTTA TGCTGATAAG 
TTCTACGAAT ATGTGAATTC ATTCGGCTGG TATGAGGTGA GAAATGCTGT AATGAATTTT 
ATAACAGACA AGAAGACTAA TCTTTTTAGT CTAACTACAG GAGTCCTTAA CTCAGTAAGC 
TCTTCTTTGA TTACGATCTT TACGATAATT GTCTTTTCGA TTTTTGTCCT AATCTATAAG 
GATATGCTAA AGACAAATGG AACAAGGATT ATCTATGCTT TGATGAGTGA AAAGAAGGCG 
GATTATATAA ACAAGGTCCT ATCCCTATCT TATAACACCT TCAAGGATTA TATTTTCTCA 
AGGCTTATAG CTGTGGTTAC CCTATCAGCC TTAACCTTTG TGGGCATGTT TATTATGGGC 
ATCCCCAACG CTGGGGTCAT CTCGCTTTTT GTGGGAGTGT CAGATTTAAT TCCAATCTTT 
GGTCCCATAG TTGGTGCAGG TCTATCGGCA GTCATTATAT TTTTGGAAAG TCCAGTCAAG 
GCTTTAATTT TCCTAATCTA TGATGTAATA ATCCAGCAAA TCCAAGAAAA TATTATCTAT 
CCTGCCATAG CTGGAGAGAA GATTGGCCTT CCTGCAGTAT GGGTCCTTGC AGCAATTACA 
ATAGGTGGGT CGCTCTTTGG CATATGGGGT ATGCTTATCG GTATTCCTGT AGCTTCTGTA 
ATATATACGC TCTTTCATGA GTTTATTGAT AATAAGCTTA AGGCTAAGGA AATAACAGAT 
AAGATGATCG AAGAAAAGAA GAATGAGAAA TACACCATGG AGGATATAGA TATTCATGAA 
GCTCAGTAG

Protein sequence

MEKLDKKSRD LLKVICYGII LFFAFWYFPV IKDGLARVVG VFQPFIIGGM IAYLVSIPMN 
YFERKLRANF PDKKYRKRIS ALSLFVSWVL IICCLILFLN ILIPRIVAVI FSFFNRWPEF 
IRETYETLNS HAITRPYADK FYEYVNSFGW YEVRNAVMNF ITDKKTNLFS LTTGVLNSVS 
SSLITIFTII VFSIFVLIYK DMLKTNGTRI IYALMSEKKA DYINKVLSLS YNTFKDYIFS 
RLIAVVTLSA LTFVGMFIMG IPNAGVISLF VGVSDLIPIF GPIVGAGLSA VIIFLESPVK 
ALIFLIYDVI IQQIQENIIY PAIAGEKIGL PAVWVLAAIT IGGSLFGIWG MLIGIPVASV 
IYTLFHEFID NKLKAKEITD KMIEEKKNEK YTMEDIDIHE AQ