Gene Apre_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0834
Symbol
ID	8397618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	913728
End bp	914966
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	36%
IMG OID	644995180
Product	phage terminase, large subunit, PBSX family
Protein accession	YP_003152583
Protein GI	257066327
COG category
COG ID
TIGRFAM ID	[TIGR01547] phage terminase, large subunit, PBSX family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00567279
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATA TCGATAAAGT TTATACTAAA AAACAACAAG AAATATATAG GGATGTAGGT 
TCTAAAGATT GGTTTATACT AATTCTCCAT GGAGCTAAGA GATCTGGTAA GACTCAATTA 
AATAATGATT TGTTTCTTAG GGAGCTTATC AGAGTTAAAA AGATTGCTAA TATGGAGAAG 
GTGGATAAGC CTCAATATAT TTTAGCTGGC TTTTCTAAGT CTACTATTTA TCAAAACGTG 
CTTATAGAAT TGTCTTCTAA GTATGGGATA GATTTCAAAT TCGATAAGCT AGGCAATTTT 
ACTATGCTAG GTGTTTATGT AGTCCAAGTT GGCCATGGTA AGATTGACGG ATTAGGTCGT 
ATACGTGGTA TGACTTCATA CGGTGCTTAT GTGAATGAGG CCTCACTTGC TAATGAGCTG 
GTTTTTGATG AAATAAGGTC TAGATGTTCA GGTAAGGGGG CAAGAATTAT TTGTGATACT 
AACCCCGACA ATCCCGAGCA TTGGCTGAAA AAAGAGTACA TCGATAATCC AACGGATAGG 
ATTTTATCTT ATAAGTTTAC TATTTTCGAC AATACCTTTC TTGATAAGAG ATATTTACAA 
TCGACTATTG ACACTACACC TGATGGGATG TTTACCGAGC GAAACATATA CGGGAATTGG 
GTTAGTGGCG AAGGTGTTGT ATATAAAGGC TTTGACCCTA AGAGACATTA TGTCAAGAGC 
TTAGATGGTA TTAGATTTAG TAGTTACATA GCTGGTGTGG ACTGGGGATA TGGACACTAC 
GGATCTATTG TAGTATTTGG CATATCTAAT GACGGTAAGT ATTACATGAT AGAAGAGCAT 
GCTGAGCAGT ATCAAGAAAT AGATTTTTGG GTAGCTGTAG CGAAAGATAT AGCTAATAGA 
TATAAGGGCA TAGTCTTTTA TTGTGATTCG GCAAGGGTGG AACATATAGA CAGGTTTAGT 
CGTGAGGGAC TTGTTGCATA TATGGCAGAC AAGGCGGTTA TTCCTGGAAT AGAGGCGGTG 
TCTATTTTAT ATAAGACGGA CAAGCTTTTT ATATATGAGT ATATAGCCAA GAGGTTTAAG 
GAAGAGATTT ATTCTTATGT ATGGGCTACT AATTACAGGT CAGATGAAGT CAAGAAGGAG 
TTTGACGATG TAATGGACTC CATGAGATAT GCTTTATATA GTTATGAACA AGGTTTGGGA 
AGTATTAAGA CCATGGATAG AAGTGTTTTA GGATTGTAG

Protein sequence

MSNIDKVYTK KQQEIYRDVG SKDWFILILH GAKRSGKTQL NNDLFLRELI RVKKIANMEK 
VDKPQYILAG FSKSTIYQNV LIELSSKYGI DFKFDKLGNF TMLGVYVVQV GHGKIDGLGR 
IRGMTSYGAY VNEASLANEL VFDEIRSRCS GKGARIICDT NPDNPEHWLK KEYIDNPTDR 
ILSYKFTIFD NTFLDKRYLQ STIDTTPDGM FTERNIYGNW VSGEGVVYKG FDPKRHYVKS 
LDGIRFSSYI AGVDWGYGHY GSIVVFGISN DGKYYMIEEH AEQYQEIDFW VAVAKDIANR 
YKGIVFYCDS ARVEHIDRFS REGLVAYMAD KAVIPGIEAV SILYKTDKLF IYEYIAKRFK 
EEIYSYVWAT NYRSDEVKKE FDDVMDSMRY ALYSYEQGLG SIKTMDRSVL GL