Gene Apre_0476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0476
Symbol
ID	8397251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	543917
End bp	545035
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	35%
IMG OID	644994833
Product	putative virion core protein
Protein accession	YP_003152244
Protein GI	257065988
COG category	[S] Function unknown
COG ID	[COG4260] Putative virion core protein (lumpy skin disease virus)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000418694
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAATAG TACAAGTTAT AAAAGGATCT GTTAGTGAAA CGATGACAAG CCAATGGAAG 
GAGCTCGTAA CAGTAGGTGA GTTTGAGGAA GATACTGCTG TTAGCCCTGG CTACATCATC 
TATGGCGGTG ATAAAAAGTA CAAAAAAGAT GTTGGTTATT TAACAAGCGG ATCAAAAATT 
CTTGTTCCCT TAAATACTTG TGCCTTTATA TTTACAAATG GTGGTATAGA AGAGGTTATA 
GCAGAACCTG GTGCCTATAT TTACGAAGGA GGGCAAAAGT CCATCTTTAA TATGGACGGA 
ATCGCTTCTT CGATTTTAGG CCAACTTAGC GATAGGATTT CTTTTGGAGG AACTAATCCC 
AACACTTCAC AAATCGCCTT TCTCAATCTA AGAGAAATTA GAAATATAAA ATTTGGAACC 
AGGACTCCTA TTATTTACAA TGACATTTTC TATGGAGTTG ACCTGGAGGT TATAGCTAGG 
GGAAATTATT CGATAAAAAT CAATGACCCA GCTACTTTTA TATATGACTT CCTCCCTGCC 
AATGCTTCTT CCTATAGTTT TGGCGATTTT AATGCTAGAA GTCAAATTAA TTCCGAGTTC 
TTGCAATCTT TTACATCTAG CATTAATTTA TTTTCCAAAG AATTTAGGAT ATCAGAACTT 
CCATCCAAGG CAAAGGATAT TGTAAATCTC ATCCTTAAAG ATGAATCTTA TGCTGGTTCT 
TGGCTTAAAA GATTCGGCTT TGAATTAGTA AATATTGGAA TTGATAGCAT AGATTTTTCT 
GAAAAATCCA AGCTTTTGAT AAATAAGTTC TCCGAAAATA GGATGGATAT GCTCTCTTAT 
GAAAATATAT CTCAAACTAG CGCAGATATT AGATACAAGC AAAAAATCGC AGAAGGCATT 
AAAGATCATG GCCTAGGCGA TGGAGCTGGC ATGGTTTTTG CCATGAATGA TGTCTTTAAT 
CAAGGAGAAA ATAGGAGGGA AGAAAATTCT TCAAAGAAGA CATCCTTATC TATCGACGAG 
CAAATAGAAA CACTCACTAA ACTTAAGAAA TTACTAGATA GCGGCATACT CACAGAAGAA 
GAATTTGCCC TAAAGAAAAA GGAAATATTA GGACTATAA

Protein sequence

MGIVQVIKGS VSETMTSQWK ELVTVGEFEE DTAVSPGYII YGGDKKYKKD VGYLTSGSKI 
LVPLNTCAFI FTNGGIEEVI AEPGAYIYEG GQKSIFNMDG IASSILGQLS DRISFGGTNP 
NTSQIAFLNL REIRNIKFGT RTPIIYNDIF YGVDLEVIAR GNYSIKINDP ATFIYDFLPA 
NASSYSFGDF NARSQINSEF LQSFTSSINL FSKEFRISEL PSKAKDIVNL ILKDESYAGS 
WLKRFGFELV NIGIDSIDFS EKSKLLINKF SENRMDMLSY ENISQTSADI RYKQKIAEGI 
KDHGLGDGAG MVFAMNDVFN QGENRREENS SKKTSLSIDE QIETLTKLKK LLDSGILTEE 
EFALKKKEIL GL