Gene Apre_1681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1681
Symbol
ID	8398493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1827869
End bp	1829749
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	41%
IMG OID	644996044
Product	oligopeptide transporter, OPT family
Protein accession	YP_003153422
Protein GI	257067166
COG category	[S] Function unknown
COG ID	[COG1297] Predicted membrane protein
TIGRFAM ID	[TIGR00728] oligopeptide transporters, OPT superfamily [TIGR00733] putative oligopeptide transporter, OPT family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0712144
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAAAAG AAAAAGAAAT TGAGAAACTT AGAGAATTTA CTCCCTTGGC TGTAGTCTTG 
GGAGTTATAA TAGCCATAGT ATTTGGTGCT GCCAATGCTT ATTTGGGACT TCGTGTAGGT 
CTTACCATAT CTGCATCAAT ACCAGCGGCT GTTATTTCTA TGGGTATAGT TAGAAAAATC 
TTAAAGCGTG ATTCTATACT CGAAAACAAC CTCGTTCAAA CAATAGGATC TGCGGGAGAG 
TCTCTTGCAG CAGGAGCCAT CTTTACCCTT CCAGCAGCCT TCTTGTGGGA AGCAGAGTGG 
GGAGATAGTC ACTATATATC GTATTTAAAT ATTTTGATGT TGACCTTGAT TGGGGGAGTA 
TTGGGTATTA TCTTTATGAT TCCTCTAAGA AGGGCACTTA TCGTTAAGGA AGATGGAATC 
TTACCATATC CTGAAGGAAG AGCCTGCGCA GAAGTACTTA AGGCAGGAGA GGCAGGAGGA 
CAAGACTCAA GCGTAGTATT TAAGGGCTTG GGCCTTGCTT CTATCTATAA GTTTTTGGCA 
AATGGACTTA AGGTCTTCCC AGAAGGGGTA AGCTATGAAA TATCTACTAA AAACTTTGGA 
GGAACTGCCC TTGGTTTCGA TGCCCTTCCA GCCCTTATGG GTGTAGGCTA TATCGTAGGG 
CCTAAAATCG ACGCTATAAT GCTTTCAGGA GGAATCCTTG CCTGGCTTGT ACTTATGCCA 
CTGCTTCACG CCTTTGGCCC AGCAGAGATA GCAAGTCTTA GCCCATCTGA CCTATGGTCA 
AACTACATCA GATATATAGG AGCAGGAGCT GTTGCTACTG GAGGAATTAT ATCTTTGATC 
AAGTCCCTTC CTATGATTAT TAAATCCTTT AAGGATTCTA TTAAGGACCT TAAGGGCAGA 
GATTCATCCC AGAGTAAGGA TAGATCTGAT GCTGATATTT CTATGAAGAC ATCCATAATT 
CTTGTAATCA TTGCAATAGT ATTGATGTTT ATGATGCCTT CTTCACCACT GAACTTCTTT 
GGTGCCTTGA TTATAGTAAT ATTTGGTTTC TTCTTTGCTA CAGTTTCATC AAGGATGGTA 
GGAATAATAG GATCTTCAAA TAACCCTGTA TCAGGAATGT CCATAGCGAC TCTCTTAATT 
GCAACCCTTC TTCTAAGACT AACAGGCTTT GTAGGCCATG ACGGAATGAT AGCGGCGATA 
TCTATAGGAA CTATAATTTG TGTAATAGCT GCTATAGCAG GAGACTGCTC ACAAGATTTA 
AAGACAGGTT ATATAGTAGG AGCAAGCCCA AGATACCAAC AAATCGGCGA GCTTATAGGA 
GTTCTCGCCT CATCCCTTGC CATAGGTGGA GTTTTGTGGA TACTAAACAA ATCTATAGGT 
TTTGGAACAA AGGACCTTCC AGCTCCTCAA GCCATGCTTA TGAAGATGAT AGTAGAAGGA 
GTTATGAACA ATGACCTTCC TTGGAACTTG GTATTTGTAG GAAGCTTTAT AGCTATTATG 
GTAGAGCTTT TGGGAGTAAC AGTCCTACCT TTTGCTATAG GCCTTTACCT ACCTATCAAC 
ACATCACTTG GAATAATGTT CGGTGGTCTT GTAAGAATCG CTGTAGATAA GATCAAGGCA 
AGTAAGGAAG AGAAAAAGGA TGCAGAGACA AGAGGAACCC TCTACTCAGC AGGTCTTATT 
GCTGGAGAAG GAATCATGGG AATAATTCTA GCAGTCTTTG CCCTAATTCC TGTCAAAGGC 
AAGACTCTGG CAGATCTTAT CAATATCTCT GATAAATTTT CCTTAAGCCA AGAAGCCTCT 
GTAGTGATAT TTGTCCTACT AGGCATACTA ATCTATAGCA AGGCAAGAGG AGCCTTAAAG 
AAGGGCAAAA ATGAAGCTTG A

Protein sequence

MKKEKEIEKL REFTPLAVVL GVIIAIVFGA ANAYLGLRVG LTISASIPAA VISMGIVRKI 
LKRDSILENN LVQTIGSAGE SLAAGAIFTL PAAFLWEAEW GDSHYISYLN ILMLTLIGGV 
LGIIFMIPLR RALIVKEDGI LPYPEGRACA EVLKAGEAGG QDSSVVFKGL GLASIYKFLA 
NGLKVFPEGV SYEISTKNFG GTALGFDALP ALMGVGYIVG PKIDAIMLSG GILAWLVLMP 
LLHAFGPAEI ASLSPSDLWS NYIRYIGAGA VATGGIISLI KSLPMIIKSF KDSIKDLKGR 
DSSQSKDRSD ADISMKTSII LVIIAIVLMF MMPSSPLNFF GALIIVIFGF FFATVSSRMV 
GIIGSSNNPV SGMSIATLLI ATLLLRLTGF VGHDGMIAAI SIGTIICVIA AIAGDCSQDL 
KTGYIVGASP RYQQIGELIG VLASSLAIGG VLWILNKSIG FGTKDLPAPQ AMLMKMIVEG 
VMNNDLPWNL VFVGSFIAIM VELLGVTVLP FAIGLYLPIN TSLGIMFGGL VRIAVDKIKA 
SKEEKKDAET RGTLYSAGLI AGEGIMGIIL AVFALIPVKG KTLADLINIS DKFSLSQEAS 
VVIFVLLGIL IYSKARGALK KGKNEA