Gene Apre_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1066
Symbol
ID	8397853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1142096
End bp	1143868
Gene Length	1773 bp
Protein Length	590 aa
Translation table	11
GC content	32%
IMG OID	644995413
Product	protein of unknown function DUF470
Protein accession	YP_003152814
Protein GI	257066558
COG category	[S] Function unknown
COG ID	[COG2898] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0261019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAT TAGTAAATAA AAAGAAAGCT ACGATATTTT TATCCTTGGT CTTACTTGCT 
CTTATTGCTT TTATAGTAGG AAAGGCAAGT AAAGATCATT ATGTTAATGG CTTCCTTCTT 
GTCTTTGCCA TACTTTCATT TACTGGAATA GGATTTCTAT CTAAAGACTT TCTTAGGAAA 
ATTAAAGAAA AATATGGTGA CTTTGCCCTA AGAGTAATTA AAGAGCTTAT ACAGAAAATA 
AATAGTATAT TTATAATTCT ATATGGAATA TATATTATAC TTTCAGTAAT TTCTTTGGAG 
AATTTCTATA ATATAGGCAA TGTAAGCAAG GACTTATCGG CTATAGAGCT TGTTTTGCTT 
ACCGTATACT TGCTTTTAGG ATATTTATTC TTAATTGCAG GAAGATTGTC CATAGATAAA 
CAAAAGAAAT CAATAAATCT TCTTATGCTT ACTGGTCTTT GTCATATTTT CTTTCTAATT 
GCAATTGGTG AAAATGTGGT ATCAATCCTA CCTGTACTTA TCCTAATGGG TCTTGGATTT 
TATACCAGAA AGTTTTTGTT TAAGGAGAGA TTCATCTATA GTTGGGAAGA GAAGACTGTA 
GATTGTGTAC TCTTTCTCGT AGGATTTTTC TTCTATATTT TAAATATAAA TAGGAATAAA 
AACTACAGCT TGCCCATGAG CCTTATATAC ACCCTACTTA TCCTTCTTAT CTTTATCCTA 
CTTACTAAGC TAATATTTTC TTATATGAAA AAAGGAGGAG AGGAACTTTA CGAGACAAAT 
ATAGACGATT TAGACTTATT GATTGATAAA TATGGGTCAA GTCAATCCCT AGCCTCTGGA 
CTATCTTTCT TAAATGATAA ATATATATAC TATTATAGGG ACAAGGACGG AGAACAAACT 
GTGGCCTTTC AATATCAAAT CATAAATAAC AAGGCAATAG TCATGGGCGA GCCTTTTGGG 
AAAGAAGCGG ATATTGCTTT AGCGCTCTTT GCTTTTAACG AAGTATGCCA AAAGTCAGGA 
CTTAATCCTA TATTTTATGA AGTGGGCGAG AGATTCACCC TAAGCCTGCA CGATTATGGA 
TATGATTTTA TGAAATTTGG GGAAAATGCC ATGGTTAATC TGACAGACTT TTCCCTAAAA 
GGAAGAAAGA AATCCACCGA GAGAAATATT CTAAACAGAT TTGCTAAAGA AGGCTATAAA 
TTTAAGCTTG TATCTTATCC CTATACTAAT GAATTCCTAG ATAAGTTAGA AGAAATATCA 
AATTCCTGGC TGAAGGATAA AAGAGAGAAG GGCTTTTCCT TGGGATTTTT TGATAGAGCT 
TATCTAAGAA GAGCGGAAAT AGCAATTGTT TTGGATAAAA ACGACGAAAT AACCGCATTT 
ACAAATATTA TGCCAAACAA GAATCCAGAA GTCCTTACTA TAGATTTGAT GCGTTATGAT 
CAAGATAAAA ATGTTAATTC TATGATGGAT TTTCTATTTC TTAATCTATT TATCTATGGT 
CAGGAAAACT CCTACAAGTA TTTTAATCTT GGAATGGCAC CCCTATCAAA CGTCGGTCTT 
ATGAAATCAG CCTACCTATC TGAAAGAATG GCTTATCTTG TTTATAAGCA TGGTAGTAGA 
TTCTATTCAT TTAAGGGCCT TAGAAATTAC AAGCAAAAGT ACGCGAGTAT TTGGCTTCCT 
AAATATATGG CCTATGCCAA GGGAAATTGG CTTTTGTACT CACTATTAGC CGTAGCCTTG 
ATTGATAAGA AAACTTCAAA AAATAATAAA TAA

Protein sequence

MNKLVNKKKA TIFLSLVLLA LIAFIVGKAS KDHYVNGFLL VFAILSFTGI GFLSKDFLRK 
IKEKYGDFAL RVIKELIQKI NSIFIILYGI YIILSVISLE NFYNIGNVSK DLSAIELVLL 
TVYLLLGYLF LIAGRLSIDK QKKSINLLML TGLCHIFFLI AIGENVVSIL PVLILMGLGF 
YTRKFLFKER FIYSWEEKTV DCVLFLVGFF FYILNINRNK NYSLPMSLIY TLLILLIFIL 
LTKLIFSYMK KGGEELYETN IDDLDLLIDK YGSSQSLASG LSFLNDKYIY YYRDKDGEQT 
VAFQYQIINN KAIVMGEPFG KEADIALALF AFNEVCQKSG LNPIFYEVGE RFTLSLHDYG 
YDFMKFGENA MVNLTDFSLK GRKKSTERNI LNRFAKEGYK FKLVSYPYTN EFLDKLEEIS 
NSWLKDKREK GFSLGFFDRA YLRRAEIAIV LDKNDEITAF TNIMPNKNPE VLTIDLMRYD 
QDKNVNSMMD FLFLNLFIYG QENSYKYFNL GMAPLSNVGL MKSAYLSERM AYLVYKHGSR 
FYSFKGLRNY KQKYASIWLP KYMAYAKGNW LLYSLLAVAL IDKKTSKNNK