Gene Apre_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0042
Symbol
ID	8396789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	51684
End bp	52652
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	41%
IMG OID	644994379
Product	protein of unknown function DUF534
Protein accession	YP_003151818
Protein GI	257065562
COG category	[R] General function prediction only
COG ID	[COG2984] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.920382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTA AGAAAATTTT AGGACTAATG TTGGCTATGA CCTTACTAGG ATCTTGTGGA 
AACAAGGCGA ATGAAACAGA AAAAAGCACT GGAGAAGGAT CAAGTGATAA GGCAAAGATA 
GGAATTGTAC AAATTGCAGA TCACCCTTCC TTGGATGCAG CAAGAGAAGG CTTTATAGAA 
AAGCTCGATA GCGAAAATAT TTCCTATGAG TTAATAGATC ATAGGGCAAA CGGAGACCTT 
GCCCTAATCC CACAATTTGC GACAGACCTT AAGAATAAAG ATGTTGACCT AATCTATACC 
ATAGGCACAC CAGCAGCCCA AGGAGTGGCC AATACCATAA AGGATAAGCC TGTTTTATTC 
GCAGCAGTAA CAGACCCAGA AGGAGCAGGA CTTAACGGAG AAAATATCAC AGGAGTATCT 
GATTATGTAG AAGCAGGAAA GCTTATAGAT GACTTCCTAA GCCTATATCC AGACACCAAA 
GTATTCGGAA CAATGTATAA TACCAACGAG CAAAATTCCC AAGTGCAAAT CGAAGCCTTG 
GAAAAGGCCC TAGAAGAAAG AGGCTTAAAG CTTGAAAAAC AAGGAGTTTC ATCCATAAAC 
GACATTCCTC AAGCTATAGC AAGCCTTAAG GGCAAAATCG ACGCTATGGT TACAGTAACA 
GACAATGTCG TTGTAAATGC TATGCCAGTT ATAAGCGAGG CCCTAGCCAA GGAAAACATC 
CCATCAATTG CCTATGACGA AGGAAGCGTT GAAAACGGAG CTTTGATGAG TGAGGGAGTT 
AATTACAGAC AGCTTGGAAG TCAGGCAGGA GCTATGGCAG CGGAGATCCT TAAAAATGGG 
AAAAATGTCA AGGATATTCT TTACGAGAAG GCAGAAAATC TCAAAGTTCT TGTCAACACC 
AAGACTGCTG AGGCTTTGGG AGTAGACTTA GATAAAGATT TACTAAAGAA TGCAGAAAAA 
ATAGACTAA

Protein sequence

MKIKKILGLM LAMTLLGSCG NKANETEKST GEGSSDKAKI GIVQIADHPS LDAAREGFIE 
KLDSENISYE LIDHRANGDL ALIPQFATDL KNKDVDLIYT IGTPAAQGVA NTIKDKPVLF 
AAVTDPEGAG LNGENITGVS DYVEAGKLID DFLSLYPDTK VFGTMYNTNE QNSQVQIEAL 
EKALEERGLK LEKQGVSSIN DIPQAIASLK GKIDAMVTVT DNVVVNAMPV ISEALAKENI 
PSIAYDEGSV ENGALMSEGV NYRQLGSQAG AMAAEILKNG KNVKDILYEK AENLKVLVNT 
KTAEALGVDL DKDLLKNAEK ID