Gene Apre_0516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0516
Symbol
ID	8397293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	593465
End bp	594562
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	39%
IMG OID	644994875
Product	periplasmic solute binding protein
Protein accession	YP_003152284
Protein GI	257066028
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTA AAAATATAAT AGGAGTTTTA GCCTTAAGTG CAGTTCTTGC TGCTTGTGGA 
AACAATGCTT CAGAAAATGC AAAGACTGAC TCTAACGAGA CAAAAGAAGA GATGACCGTA 
AAGGAAGATA GCAAAGACCA AGCTAAGTCT AGTGAAGATA AGAAGGATTC ATCTGCTGAA 
AAAGCTAGTG AAGAAAATGT AATCTATGCT TCATTTTTCC CAATCTATAA TCTTACTAAG 
CAAATCGCAG GAGATAAGTT TGAGGTGAAA TCTTTTACAA ATCTTAAGAC AGAAAGTCAT 
GGATTTGAGC CTTCTGCAAA GGAAATTGCA GAATTATCTA CTTCAAAACT TATGTTTGTA 
AATGGTGCTG GTATGGAAGA GTGGGAAGAA GCCGTAAAAA ACACAGTAGA TATTGATATT 
GTAAATACAA GCGAGGGAAT CGATCTTATT AAGGCAAGCG AAGATGATCA CGATCATGAC 
CATGAAGACG CAGACCACGA CCATGATCAT GAAGATGCAG ACCATGATCA CGACCATGAA 
GATGGTGAGG AAGGTCATGA ACATCACCAC CACGGTGAGT TTGACCCACA CACATGGCTA 
GATCCAGCAA ATGGTAAGGC TCAAGCTAAG GTAATAGCTG ATAAGCTTTC AGAAGTAGAC 
CCTGCCAACA AGGATTACTA CATGGCAAAT TACGAAAAGA TTGCCAAAGA ACTTGATGAC 
ATAGTTACTG AATACAAGGA TAAGTTTAAA AATGTAGATA ACAAGAAGTT TATTGTTCCT 
CACCAAGCCT TTGGCTACCT TGCTCGTGAG TTTGACCTAG AGCAAATCCC ACTTAACTCT 
CTAACATCTA CTGGAGAAGC TGATGCTAAG GTCCTTAAGG AAGTATCTGA TCTTGCTAAG 
GCTGAAAAAA TTAAGACAGT CTTCTACGAA ATGGGCGGTT CTGATAAGGA AGCAAAGACC 
CTAGCAGATG AAATCGGTGC TGAGGCTAAG CCAATCAACA CACTCGAGTT TGCAACTGAC 
GAAGAGCTTT CTTCAAACAA GACCTACCAA GAAATGATCA AGGAAAACTT AGAAGCAATC 
TACGATTCTC TATCATAG

Protein sequence

MKVKNIIGVL ALSAVLAACG NNASENAKTD SNETKEEMTV KEDSKDQAKS SEDKKDSSAE 
KASEENVIYA SFFPIYNLTK QIAGDKFEVK SFTNLKTESH GFEPSAKEIA ELSTSKLMFV 
NGAGMEEWEE AVKNTVDIDI VNTSEGIDLI KASEDDHDHD HEDADHDHDH EDADHDHDHE 
DGEEGHEHHH HGEFDPHTWL DPANGKAQAK VIADKLSEVD PANKDYYMAN YEKIAKELDD 
IVTEYKDKFK NVDNKKFIVP HQAFGYLARE FDLEQIPLNS LTSTGEADAK VLKEVSDLAK 
AEKIKTVFYE MGGSDKEAKT LADEIGAEAK PINTLEFATD EELSSNKTYQ EMIKENLEAI 
YDSLS