Gene Apre_1771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1771
Symbol
ID	8368686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013164
Strand	+
Start bp	37259
End bp	38902
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	31%
IMG OID	644984702
Product	extracellular solute-binding protein family 5
Protein accession	YP_003142353
Protein GI	256821154
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR02294] nickel ABC transporter, periplasmic nickel-binding protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAAAC TTAGAAAAAA TATGATGGTT TTATTGGCAC TTGTATTTAG TTTTTCAATT 
TTACTAGGAG GTTGCCAAAA GAATCAAGAA AAAGCACAAG AAAATTCAAA TGTAGCAAGT 
GAGAACACAA AAGATGAAAG CAAGAAGGTT TTAACCTTAT GTACTGCTAA AGAACTGACA 
AACCTTACGA CTTTAACAAT GAATAAGGAA AATAATATGG CTTGTGGTTT AATTTACGAA 
ACCCTAGTAG CTTATGAAAA CGGTGAAATT GTACCAAAAC TTGCTGAAAG CTTTGAATAT 
AAAGATGATG GCAAAACTTT AGTCTTTAAA TTAAAGGACG GGGTAAAGTT TTCAGATGGT 
GAAGATTTTA ATGCTGATGC AGTAAAAAAG ATATTAGATT TTGATAAGTC TAACCCTAAT 
TTTGCAGGCA TAAGGGCTGT TGCAGAGATA AAATCAACAG AAGTTATTGA TGATAATACG 
ATTGCTGTTC ACTATGAAAA TCCGTCTAAA TTTTATATAA ATGGCTTTTG TTTCCAAAAT 
GTATTGGGGA TGCCATCTCC AAAGTCATTT ACTGAGGGAA ACTTTGAGAA ATTTAACAAA 
AATATAGGAA CAGGTCCTTA TGTATATGAA GAATTTAAAT CTGGAGAATA TACAAAATTT 
GTTAGAAATG AAAATTATCA TGGGGAAAAA CCTTATTATG ATGAAGTTAT TGTCAAATAT 
ATTCCCGATG CTTCCTCAAG ACTTCAAGCC TTAAATAAGG GGGAAATAGA TTTAATTTAT 
GGAGCAGATT TAATAAATTA TGATGACTTC AAAAAAGGTT CTGAAATTAA GGATGTTACT 
GGAGAAGTCA ACAAAAATAG GACTTTGACT AAGAATCTAA TTTTAAATCC AAGTAAAAAA 
GAATTAGAAG ATTTAAGAGT TCGCCAAGCA ATTAATTATG CAATTAACAA AAAAGACATT 
GTCGACAGTT TAACATACTC ATATGAAGAT GTAGCTGAAA CTTTATTCCC TAAAGATGTA 
GCTTATTGTG ATGCAAATTA TCCAACTAAT TATAGTTATG CTCCTGAAAA GGCAAATAGC 
TTGCTAGATG AAGCGGGTTG GAAACTCAAT AAAGATACAG GAATTAGAGA AAAGGACGGA 
AGTCCATTAA AGCTTCAATA TGTTTACTGG TCAGATTTAG TACTTGCTAA GGAAACTGCA 
CTTGCAATAA AGACACAATT AAAAGAAGTA GGTATAGATG TTGACCTAGT TGAAAAAGAT 
CAAATGTCAT GGTGGACAGA TGGTATAAAG GGAGAATTCC ATTTGACAAC CTGGAATACA 
GAGGGTTCTT ATACTGAACC TCATAAGTTC TTACAAGAAT CAATCACCGA AATGGATCCA 
CATTTGATGC CGTTAAAAGC ACTTTCTGAT TCAAACATAT ATATTGATGC AATAAAGAAA 
GCTTCCACTT CTACAAATGA AGGGGAGATT AAAGATAATA TACAAAAAGC TATAGTATAT 
TCAAACGAAA ACGCTATGGA TTTGCCTCTT TCTTATTCAA AAGAAATGAT TTTGTATAGA 
AATGACAAAA TTGGTGGATA TGACTTTACA AGTACACCTC AATTTTTCAA TATTTACAGT 
GTAAAAGCTA AGACAAGTAA ATAA

Protein sequence

MIKLRKNMMV LLALVFSFSI LLGGCQKNQE KAQENSNVAS ENTKDESKKV LTLCTAKELT 
NLTTLTMNKE NNMACGLIYE TLVAYENGEI VPKLAESFEY KDDGKTLVFK LKDGVKFSDG 
EDFNADAVKK ILDFDKSNPN FAGIRAVAEI KSTEVIDDNT IAVHYENPSK FYINGFCFQN 
VLGMPSPKSF TEGNFEKFNK NIGTGPYVYE EFKSGEYTKF VRNENYHGEK PYYDEVIVKY 
IPDASSRLQA LNKGEIDLIY GADLINYDDF KKGSEIKDVT GEVNKNRTLT KNLILNPSKK 
ELEDLRVRQA INYAINKKDI VDSLTYSYED VAETLFPKDV AYCDANYPTN YSYAPEKANS 
LLDEAGWKLN KDTGIREKDG SPLKLQYVYW SDLVLAKETA LAIKTQLKEV GIDVDLVEKD 
QMSWWTDGIK GEFHLTTWNT EGSYTEPHKF LQESITEMDP HLMPLKALSD SNIYIDAIKK 
ASTSTNEGEI KDNIQKAIVY SNENAMDLPL SYSKEMILYR NDKIGGYDFT STPQFFNIYS 
VKAKTSK