Gene Apre_0238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0238
Symbol
ID	8397012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	270458
End bp	271729
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	39%
IMG OID	644994599
Product	extracellular solute-binding protein family 1
Protein accession	YP_003152011
Protein GI	257065755
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA ATAAGAGATT TATTATAAGG AGGATGGTCT TCTTTTTGAT CGTTCTCATA 
AATCTTACTT CCTGTTCTAA TAAGGAAGAA AAGTCCGCAG ACGGTAGGGT CGTAATTGAA 
TTTTTCAACC AGAAAAAAGA AATGGTCGAC ACCTTAGAGG AAATAGTAAA AGATTTTGAA 
AAAGAAAATC CTGACATAAA GGTAAACATG ACAAGCGTAC CGGATGCCGG AACAGTTCTT 
AAAACCCGTA TGCTTGCAGG CGATAGCCCA GATATCGTCA ATATCTACCC ACAAAATATG 
GACTTTAAGG AATGGGCCAA GGCGGGCTAC TTTAAAGATC TAAGCGAAGC GAGCTATCTT 
TCCAATATAG TAAATGATTA TGAAAAAAAG TACGCCATAG ACGGCAAAAT TTACAATGTC 
CCTCTATCAG CTAACTTCTA TTGTATCTAC TACAATAAGA CAAAATTTGA TGAATTAGGG 
CTAAAGGTTC CTGAAACTTG GAAAGAATTC AAAAAGCTTG TAGAAGATAT CAAGGCTAAG 
GGAGAAGTTC CTTTTGCCGT AGCAGGTAGT GAGGGTTGGA CTCTAAATGG ATACCATCAA 
CTTTCTTTGA TTAATATAAC AGGTAGTGAT GAGGGAGCAA ACGATTACTT AAGATATTCT 
GAGGTGAATT CAATAAATGA AAATGACGAT ACTCTAGTAA AAGACAGCGA GTACCTAGAC 
TTGCTAGCAG ATAAGGGAAA TGCTCAAAGA AACTGGGAAG GGGCCTCCTA CAATGATTCT 
GTGGTTGCCT ACGCAACAGA AAAATCCCTA ATGCTTGCTG GTGGATCTTG GGTACTTGCG 
GCAATTAGCC AACAAAACCC TGAATTTGAA GTAGCTACCT TTGCTTTCCC AGGAGTAAAT 
AAGGGAGAGG AAGTTACAGT AGGAGCAGGA GACTTGGCAC TTTCTATATC AGAAAATACT 
AAACACCCTG AAGAAGCAGA CCGCTTTCTA GAATACATGA CAAGTAAGGA AGCTATGCAA 
AAGTACTACG ACGTAGATGG ATCACCGGTT GCTGTAAAGG GAGTAAAGGA GAATGAAGAT 
TCGCCACTTG CACCTTTGTA TAAGCTTGCT TTTACCGACA GACATTATGT TTGGTTGGGT 
CAAGAGTGGA ATAGTGAAGA GGACTTCTTC CAAGCTACAA CTAATTATCT ACTAACACAA 
GACAGGGCCC AATTAGCTAA GGAGCTCAAT GCTTTCTTTA ATCCGATGAA AGCTAGCAAT 
AAAAAGGAGT AA

Protein sequence

MKKNKRFIIR RMVFFLIVLI NLTSCSNKEE KSADGRVVIE FFNQKKEMVD TLEEIVKDFE 
KENPDIKVNM TSVPDAGTVL KTRMLAGDSP DIVNIYPQNM DFKEWAKAGY FKDLSEASYL 
SNIVNDYEKK YAIDGKIYNV PLSANFYCIY YNKTKFDELG LKVPETWKEF KKLVEDIKAK 
GEVPFAVAGS EGWTLNGYHQ LSLINITGSD EGANDYLRYS EVNSINENDD TLVKDSEYLD 
LLADKGNAQR NWEGASYNDS VVAYATEKSL MLAGGSWVLA AISQQNPEFE VATFAFPGVN 
KGEEVTVGAG DLALSISENT KHPEEADRFL EYMTSKEAMQ KYYDVDGSPV AVKGVKENED 
SPLAPLYKLA FTDRHYVWLG QEWNSEEDFF QATTNYLLTQ DRAQLAKELN AFFNPMKASN 
KKE