Gene Apre_0094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0094
Symbol
ID	8396845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	115552
End bp	116700
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	37%
IMG OID	644994433
Product	hypothetical protein
Protein accession	YP_003151868
Protein GI	257065612
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000042098
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACAT ATATTAAAAG GTTAAATTGG GAAGAGAGCA TTTATCTAGC TATTAATAAG 
CTCATAGCAA AACATGGCAA GGACAACGAG GCCTACAATC CAGATAATAA ACCCTTCGCA 
GTCTTTGATT GGGATAACAC TTCGATCATA GGAGATGTGG AGGAAGCCCT TCTCTATTAC 
ATGGTTAGGA ATGTAAGCTT CAAGATGGAT CCAGAAGAGT TCTATGAATT GATCAGAAAA 
AATGTAGATA GGAAAGATTA CCCTAAGGAA TTTAATAATC TAGATAAGCA AAGGGTAAAC 
ATCGATCTAA TTTCCCAAGA TATAAAAAGA GCTTATGAGA AACTCTACAA AAATCTAGAT 
AGGTTTGAAG GAGGAAAGAC TCTGGAGGAA GTCCAAGATA CAGATTACTA TCAGGAATTT 
GTAAGCAAGA TGCTCTACAG ATACAGGGCG AGTGAATTCG ACCCGGAAGC AGAAGATCCT 
TATTGTTGGA TGAGCTTTCT TCTTAAAAAT TACAAGACTG AGGAAGTCTA CGATCTTTGT 
AAAGGTGCCT ACGCATCCAT GAAAAAAGAG AGGATAAGAG TTGAAGAATT TGTGTCTCCA 
GACATTAAAT CAGAGGCAGG TAGGATCTCT ATTAAATATT TTGTTGGAAT AAGAACCTTG 
GACGAGATGG TAGATTTATA CCGAAGTCTT GAAGAAAACG GCATAGATTG CTATATAGTT 
TCCGCCTCCT TCATAGATAT AGTGAGGGCC TTTGCGACAG ATACTAATAA TAATTATAAG 
ATGAAGGAAG AGAAGGTCTT AGGCCTAAGA CTTATGAAAG ACGATGAGGG AAAAATTCTT 
CCAAAGTTCG ACAAAGATTT TCCTATAAGT ATCAGAGAAG GCAAGGTCCA AACTATTAAT 
AAACTCATCA AAAACGACAG AAATTACGGG CCTATAATGG TTGGAGGAGA TAGTGACGGT 
GATTTTGCCA TGCTTAAGGA GTTCGATCAT ACTGATCTTT CCTTGATAAT TCATAGGGCG 
AATTCCGGCT TAATAGATGA TTTAAGACAA AAAGCTCGGG AGGGCTCTCT TAGGTATTAC 
TCTCAAGGAA GAAATTTACT AGAAGCATCT TTTGTTCCAA GCAACAAATC AGAAGGATAT 
AATGAATAA

Protein sequence

MKTYIKRLNW EESIYLAINK LIAKHGKDNE AYNPDNKPFA VFDWDNTSII GDVEEALLYY 
MVRNVSFKMD PEEFYELIRK NVDRKDYPKE FNNLDKQRVN IDLISQDIKR AYEKLYKNLD 
RFEGGKTLEE VQDTDYYQEF VSKMLYRYRA SEFDPEAEDP YCWMSFLLKN YKTEEVYDLC 
KGAYASMKKE RIRVEEFVSP DIKSEAGRIS IKYFVGIRTL DEMVDLYRSL EENGIDCYIV 
SASFIDIVRA FATDTNNNYK MKEEKVLGLR LMKDDEGKIL PKFDKDFPIS IREGKVQTIN 
KLIKNDRNYG PIMVGGDSDG DFAMLKEFDH TDLSLIIHRA NSGLIDDLRQ KAREGSLRYY 
SQGRNLLEAS FVPSNKSEGY NE