Gene Apre_0147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0147
Symbol
ID	8396898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	174029
End bp	175501
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	38%
IMG OID	644994485
Product	extracellular solute-binding protein family 1
Protein accession	YP_003151920
Protein GI	257065664
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTAC TAAAAAAACT TAGCATAAGC ACACTCCTAG TTGGACTTAG CTTAAGTCTT 
TCTAGCTGCA CAGCTTCCGA TAATAAAGAA AAGTCCAAAA AAGCTTCAGA AGAGCTTCCT 
ACCATAACTT ATTATGATGT AGGAACTCCA CAAGAAGATA CAGGAGAGGT GGTAGAAGCT 
ATAAATGAAT ATCTAGATAA ATCTGATGCA GGATATCACC TAAACCTACA ATTTTTCGAT 
TGGGGCGAAT ATGAACAAAG ACTTCAGCTT GCGTCAAATG CGGGAGATGA CTGGGATATA 
GCCTTTACAG CTAACTGGTC TGGTCCTTAT AAAAACTTGG TAGAGAAGGG AGCCTTTGCT 
GACATAACGG ATCTTATAGA TGAAAAAGGT CAAGCTATAA AAGATTCTCT TTCAGAAGAC 
GTATTAAAGG GAGCTTCTAT TGAAGGAAGA CTATATGGTG CGCCAGCAGC TGCTAAAAAT 
GTTGTTCCAG GCAATTATTT CGTTTGGAAT AAAGCTTATG TAGATAAATA TAAGATTGAT 
ATAGATAGTG TAAAGACTAT AAAAGACCTT GAACCTTATC TTAAAGAGGT CAAGGAAAAT 
GAAGCGAGCG TCGATTATCC TTTCAACATA GTAAGTGATT TCCTCCTTCA AACACCAACT 
CCACAGTCTG AAGCGACACC AGGAGTTGCC GTAAAAGAAG AAAATGGAAA GCTCATCGCC 
TACAATAGCT GGGCTGACCC AGAGCTTAAG AAACAATTAG ACGTCCTAAA AGACTACATG 
GACAAGGGTT ATATTAACCC ATCAGCTCCT CAGATGAATG CGGGAGATGG AGAAGAAGGT 
GATAGGTGGC TAGTAACAAA AGCCGAAGGA GGTCCAGATT CGGATGGGAT TTGGTCTAAC 
TCCTTCAAGA GCGAAGTCAT ATCCTCCCCA GCAGGTAACA AAACAATAGT AACAAATCAA 
AAAGCTACTG GTTCTCTTGC CGCTATTAAC TCCCAATCTG AGCACAAAGA ATTGGCTATG 
GATTTTCTAA ATAGAATGTA TAGCGATAAG GAGCTTATGA GATATCTAAC CTATGGAATA 
GAAGGCAAGC ACTATGATTT AGTAGATGGA AAGGTTGAAA AGTACGAAGA TACTAAATAT 
GACGTACCAG CCTTTACCTT CCTAGCCTCT GAAAATATGA CACCACTTAC TACATCTGAA 
GATTCTGACA CGCCAGAAGC TAAGGAAAAA CTAGATAAGT TTTTAGAGAA TTTAGAGCCT 
TCTCCTATAC TAGGTTTCAA CTTTGATAGG AAAAGCGTTG AAAGCGAGGC AGGAAATGTT 
GAACAGACAA TTTTCGAATA CGAGAAAAAT CTCAAAACAG GTGCCTTTGA TGAAGACTAT 
TATCAAGAAT TCTTAGATAA GCTTAATACT GCTGGAATTG ATAAGTTGAT AGAAGAAGTC 
CAAAACCAAT TAGATAATTG GGATAGGAAA TAG

Protein sequence

MNLLKKLSIS TLLVGLSLSL SSCTASDNKE KSKKASEELP TITYYDVGTP QEDTGEVVEA 
INEYLDKSDA GYHLNLQFFD WGEYEQRLQL ASNAGDDWDI AFTANWSGPY KNLVEKGAFA 
DITDLIDEKG QAIKDSLSED VLKGASIEGR LYGAPAAAKN VVPGNYFVWN KAYVDKYKID 
IDSVKTIKDL EPYLKEVKEN EASVDYPFNI VSDFLLQTPT PQSEATPGVA VKEENGKLIA 
YNSWADPELK KQLDVLKDYM DKGYINPSAP QMNAGDGEEG DRWLVTKAEG GPDSDGIWSN 
SFKSEVISSP AGNKTIVTNQ KATGSLAAIN SQSEHKELAM DFLNRMYSDK ELMRYLTYGI 
EGKHYDLVDG KVEKYEDTKY DVPAFTFLAS ENMTPLTTSE DSDTPEAKEK LDKFLENLEP 
SPILGFNFDR KSVESEAGNV EQTIFEYEKN LKTGAFDEDY YQEFLDKLNT AGIDKLIEEV 
QNQLDNWDRK