Gene Apre_0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0349
Symbol
ID	8397123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	397651
End bp	399273
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	29%
IMG OID	644994707
Product	protein of unknown function DUF87
Protein accession	YP_003152119
Protein GI	257065863
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGATTG ATCAATTTTA TACAGATATC GATAAAAATA ATTTTTATTT AGGAATGGTT 
TCACAAGTAT ATAAAGATGG GTTTGTGGTG CAAATTGAAA ATCTATCATG GTTACGACAA 
AGAAGAATAA ATTTAGAATT GTTAGTACCT AATATAATTA ATTATTATGT TGTTATTGAC 
TCGATACAAG GTTTGTTTAT AGGGGAGGTA TATCAGTCTA AAATCTCAAA TTCAAAGAAT 
ACTCATTATG AATTAAATAA TGAGACTTAT GAAAATATTT TTTCTGAATT ATCAATAGAA 
ACTATCGGCT TATTAGCAGC AGAAGATTCT GGTTTTATTT CTCCAGGATT TAAAACTGTT 
GGTCTTACTG ATAAGGTCTA TATTGTTAAC GATGAAATAA AAAAAAGATT TCTTAAATCA 
GTTGAGAATA AGAGGTTAGA TAAAAACTAT TTAGATAAAA AACTTAAACC ATTCGCAACT 
GCTTCAAATC TTGGTGACGA TACAATATCA CTACATCCAG AAACTCTATT TGATAGACAT 
TTAATGACGA TAGGTACAAC TAATAGTGGT AAATCTACTA CAGCATTATC AATTTTAGAT 
AAACTTATAT TAGCAGAAAA AAAAGTTTTA ATTATTGATC CAACAGGTGA ATATTTAGAC 
GCATTTTATG AAGATGATAT CAAACAACTA ACTTTAGGGA GAGATACAGT TTTAACACCA 
GGCAAGGTTT CATATTCTCA GCGGGCAATG TTATTTGAAA CTAATGATTC AACTCAACCA 
GCTGTAATTG CGGATGCAAT TACTAGCCTT AGGTATCAAA AAAGGGAAGG TAATGACTGT 
GCACTTGTAA AAGAAGGAAA AGAGATAAAA GATATAAATA ATAAATTAAA AAGCTTAACT 
GAGGAAGATT TGGATTTTGA TTTAGATTTG TTACCCAAAC AGATATTAGA AGAGGGGGTT 
GAAGCCGATA GAAAAATGCA ACTGTATCAG AAGGGGGCAT TTCAATTTAA TAATAAACAG 
TGGCTATTTC AAAAAGTTGA ATATAAATTA AGAAATTCTG AACTTTTAAA TTTTTTCAAT 
TCAAAAAATG ATAAATTTGA TTTACTTGGT GAGATAGATA GATTCATAAA AAATGAAACT 
AAAAGTTTAT ATATAAATAC ATCAGAAATT GGTGTTGGTG ATGGAATAGG AGCCATGATT 
ATTGATTTAA TTAGTAATTA TATAATTAAT CACAAAGACA AGAATGATGT AGCATTCGTA 
ATATTTATTG ATGAAGTTCA TAGGTACTCT AAGGATATAG GAGGAGTGAG ATATCAAACT 
GGTTTAACAG CAATTGCAAG GGAAGGGAGA AAAAAGGGGA TTTTTCTCTT TTTGACAACA 
CAAAATCCAA ATGATGTACC ATCTGATTTA TTAGGACAGA TAGGGTCGTT ATTAATTCAT 
AGATTAACTC ATAGGTATGA GATAGAGTCT ATTAGGAATT ATCTATCAGA TAGTAGCCTA 
AGACAAGTTC CTAAACTTAA TCAAGGTGAA GCAATTTTCA CAAGCATTAA TTTACTTAAA 
GATCTCAATC TTAAGATTGA AAAATGTTCA AGAATACATT TTAATAATAC CACTAAATTA 
TAA

Protein sequence

MVIDQFYTDI DKNNFYLGMV SQVYKDGFVV QIENLSWLRQ RRINLELLVP NIINYYVVID 
SIQGLFIGEV YQSKISNSKN THYELNNETY ENIFSELSIE TIGLLAAEDS GFISPGFKTV 
GLTDKVYIVN DEIKKRFLKS VENKRLDKNY LDKKLKPFAT ASNLGDDTIS LHPETLFDRH 
LMTIGTTNSG KSTTALSILD KLILAEKKVL IIDPTGEYLD AFYEDDIKQL TLGRDTVLTP 
GKVSYSQRAM LFETNDSTQP AVIADAITSL RYQKREGNDC ALVKEGKEIK DINNKLKSLT 
EEDLDFDLDL LPKQILEEGV EADRKMQLYQ KGAFQFNNKQ WLFQKVEYKL RNSELLNFFN 
SKNDKFDLLG EIDRFIKNET KSLYINTSEI GVGDGIGAMI IDLISNYIIN HKDKNDVAFV 
IFIDEVHRYS KDIGGVRYQT GLTAIAREGR KKGIFLFLTT QNPNDVPSDL LGQIGSLLIH 
RLTHRYEIES IRNYLSDSSL RQVPKLNQGE AIFTSINLLK DLNLKIEKCS RIHFNNTTKL