Gene Apre_0051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0051
Symbol
ID	8396798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	61401
End bp	62537
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	41%
IMG OID	644994388
Product	extracellular solute-binding protein family 1
Protein accession	YP_003151827
Protein GI	257065571
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.115612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA TTACGAGATT GTTAATGGCA ATTGTTATGA TCTTTACCCT AAGTGCTTGT 
GGGAATGCCG ATAACAAGAC AGAAGAAGTA AACGAAGACC AAAAGACTGA GACTAAGGTT 
GAAGAAAAGA ACGACGATAA GGAAGTCGAA GATAAGAATG AGGGAGTAGG AGAAGCTGAA 
ATAGACCTTC CTGACTTTGA GGGAAGAAGT CTAAATGTAG TCGCTACAAG TGATTCTTAC 
GTTCCTTTGT TCGATAGGTT CAGTGAACTG ACAGGAGCTA AGGTAGAATT TTTATCAATG 
TCTTCTGGTG AAGTTATAAC TAGAACAAAG GCTGAAGGCA AGCCAATGGC GGACCTATGG 
TTTGGTGGTG GACTCGATGC CTTTATGGCA GCTAAGGAAG ATGGCCTCCT TGATTCCTAC 
AAGTCTGAAA TGACAGATAA GGTTCCAGAA AGATTTAGAG ATGAGGAAGG TTATTATACA 
TCCAAGGGTC TTACAGTAGT GGGTTTTATT GTAAATGATC AAATCCTTGA AGAAAAGGGA 
CTTGAAGCGC CAAAAACATG GAAGGACCTT GCCAAGGAAG AGTACAAGGG AGAGATAATC 
ATGTCAAACC CTGCAATCTC TGGGACAAAC TACGCTGCCC TTAAGGGACT TCTCGACCTA 
TATGGGGAAG AAGAAGGCTG GGCCCTTTTT GAGAAAATCA ATGAAAATAT AGATTTCTAC 
TCAAAAAGAG GAAAAGACCC ACAAGAGAAG ACTGCCCAAG GAGAATTTGC TATTGGAATC 
ATTCCTGTAG ACAAAAAGGC CTTTGATGCA GCTCGCGACA ATGGACTTTC TGTAGTTTAT 
CCAGAAGATG GGGTAAGCTG GGTGCCAGAA GGAGTTGCTG TATTTAAAGA TAGTGAAAAT 
GCTGATGTAG CCAAGGCTTT CGAAGACTTT ATGTTGACAA AGGAAGCCCA AAAGATGATT 
GCAGAAATCG ACGGAAAAGA CACTAACCAG CTAATCGTCG AAGGAGCAGA GGGCTTTGAC 
CTAGATCTTC CTAAGGATAA GCTAGTCGAC GAGGACCTAT CAACATTTGG TACGAAGAGA 
GACGAAATAT TAAATAAATT CAAAGAAATA GCCAAGGATA AGGCTAGAGA AGAATAA

Protein sequence

MKKITRLLMA IVMIFTLSAC GNADNKTEEV NEDQKTETKV EEKNDDKEVE DKNEGVGEAE 
IDLPDFEGRS LNVVATSDSY VPLFDRFSEL TGAKVEFLSM SSGEVITRTK AEGKPMADLW 
FGGGLDAFMA AKEDGLLDSY KSEMTDKVPE RFRDEEGYYT SKGLTVVGFI VNDQILEEKG 
LEAPKTWKDL AKEEYKGEII MSNPAISGTN YAALKGLLDL YGEEEGWALF EKINENIDFY 
SKRGKDPQEK TAQGEFAIGI IPVDKKAFDA ARDNGLSVVY PEDGVSWVPE GVAVFKDSEN 
ADVAKAFEDF MLTKEAQKMI AEIDGKDTNQ LIVEGAEGFD LDLPKDKLVD EDLSTFGTKR 
DEILNKFKEI AKDKAREE