Gene Apre_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1840
Symbol
ID	8368747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013164
Strand	+
Start bp	103643
End bp	105418
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	25%
IMG OID	644984763
Product	ABC transporter related
Protein accession	YP_003142414
Protein GI	256821215
COG category	[V] Defense mechanisms
COG ID	[COG2274] ABC-type bacteriocin/lantibiotic exporters, contain an N-terminal double-glycine peptidase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.301494
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAAGG ATAAAATAAA TCATCTTGAA TGTATAAAAA TAGCATTCAA GATGATTTAT 
GAAACAGATA AAAAGTCTTT TGCGATCATT ATTATATTGT CAATTGCAAG TGGTATTTTT 
CCTTTTTTAG TACTTAGATT AGGACAGACA ATAGTTAATA TAATTCAAGT TCATTCTATT 
AAATTTGATA TCATTATAAG GCTTATATAT ATATATTTAT CTTTACAATT TATATCTATA 
ATAGTAGATA ATATTAAAAA TTACTATTTA CAAAGATTGA GTAATGAAGT TATTTATTCT 
TCCATGAGCA AAGTAATGGG AAAATGTGCT GATTTACCTT TAAAAAAGCT TGAAGATAAT 
AAAACTTATG ATATTTTGAA TAGAATAGAG CAGGATGCTA CATTAAAGCC ATATGAAATA 
TTAATGGCGG TTATAGGTTT ATTTTCTAGT TTGACACAGA CTATTATAGC CATATATGTA 
TTAATTAAAT GGAATTATTA TCTGGTTCTT CTTTTGTTTG TAGTTACCAT TGTATCAGTA 
TTTGGAGAAA TAAGAATAGG TAAATTAGAG TTTAATATTA GAAATAGAAG GAGTAATTTA 
GAGAGGAAAA GTTGGTATTA TTCTTTTTTA TTAACCCATG ATATTGCTTT TAAGGAGATC 
AAAACTTTTA GGTTGAAAAA TTATTTTCTT AATAAGTATA CAGAAATAAC AGATACTATT 
ATTAATCAAA ATAATAGCAT TGAAAAATTG AAAGCTATAT TAATAATTGT TATAAATTTT 
ATTCAAATTC TTATTAATAT ATATATATTT AAAGAACTTG CATTTAAAAC GTATAATGGA 
GACTTTTTAA TTGGAACAGC TATGATGTAT ATAAACACAA TTGCTATATT TCAAGGTTCT 
CTTAATGAAA CAGGAACTAG TGTATACAAT ATTATTAATT CAAATTTATA TATAAATTTA 
CTTAAAGAGT TTCTTGAATT TAAAACTGAC GATTTAAAAG AAGAGACAAA AACTATACTA 
AGATCAATAA AAGACATTAA TGTAATATCG TTATCTAATA TAAACTTTTC TTATGATGAT 
AATAGTTTAG CTCTGCAAGA CATTTCTTTA AAGATAAAAA AAGGAGAATC CATTGCAATA 
ATTGGGGAAA ATGGTTCAGG AAAAAGTACA CTTCTAAAAA TTTTAGCTGG ATTGTATAGT 
CCAGATTCAG GTGTGTTTTT AATTAATGGG ATGAAATTTG ATGATATTGA AATAGAATCT 
TATAGAACAC AGATTAGTTC ATTATTTCAA GATTATTTGA AATATGAGGG GACAATAAAA 
GAGAATATTA TATTAGGGCA AATTGATAGA AATGAAGACG ACTTTTCGAT TCTAACAGCA 
TTAAATAGTG CTGATGCAAA ATTTTTAAAA AATGATGGTA AATATAATAT TAATAAAGTA 
GTAGGTAATT GGTTTGAAAA TGGGCAGGAA CTTTCAGGCG GACAATGGCA AAAAATTGCA 
ATAGCACGAA CTATGTATAG AAAATCAAGT CTATTGTTAT TTGATGAGCC AAGCTCGTCA 
TTAGACATAA TTTCTGAAAA AATCATATTT GATAATATTT TAAATAATTT GAATGATAAG 
ATTATTATAT ATATCACCCA TAGGATAAGA TGTGCGATGA ATTCTGATAG AATTATTGTG 
ATGGATAATG GAAAAATAGT AGGTGATGGG AGTCACGATG ATTTAATTGA AAACTGTAAT 
AGATATAAGT TAATGTATAA TAAGGAATTT AAGTGA

Protein sequence

MGKDKINHLE CIKIAFKMIY ETDKKSFAII IILSIASGIF PFLVLRLGQT IVNIIQVHSI 
KFDIIIRLIY IYLSLQFISI IVDNIKNYYL QRLSNEVIYS SMSKVMGKCA DLPLKKLEDN 
KTYDILNRIE QDATLKPYEI LMAVIGLFSS LTQTIIAIYV LIKWNYYLVL LLFVVTIVSV 
FGEIRIGKLE FNIRNRRSNL ERKSWYYSFL LTHDIAFKEI KTFRLKNYFL NKYTEITDTI 
INQNNSIEKL KAILIIVINF IQILINIYIF KELAFKTYNG DFLIGTAMMY INTIAIFQGS 
LNETGTSVYN IINSNLYINL LKEFLEFKTD DLKEETKTIL RSIKDINVIS LSNINFSYDD 
NSLALQDISL KIKKGESIAI IGENGSGKST LLKILAGLYS PDSGVFLING MKFDDIEIES 
YRTQISSLFQ DYLKYEGTIK ENIILGQIDR NEDDFSILTA LNSADAKFLK NDGKYNINKV 
VGNWFENGQE LSGGQWQKIA IARTMYRKSS LLLFDEPSSS LDIISEKIIF DNILNNLNDK 
IIIYITHRIR CAMNSDRIIV MDNGKIVGDG SHDDLIENCN RYKLMYNKEF K