Gene Apre_1132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1132
Symbol
ID	8397919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1215503
End bp	1217173
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	40%
IMG OID	644995478
Product	NLP/P60 protein
Protein accession	YP_003152879
Protein GI	257066623
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0791] Cell wall-associated hydrolases (invasion-associated proteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000155845
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA AAAATATAGG AGCTATGCTA TCAGTTATAG CTGCAGTTAC AGCAGGTGCG 
AGTGCATATG CTACTACAAT TGACAATTTA GACCAAGATC AACATACAAA TTCGCTAATT 
ACAGAAGCGA ACTATACAGA AAGCTATTCT GATTATGATC TAGTGAAATC TGAATATACT 
GAAGATGTAA AAAACACAAA AATTGCTAAA GAAGACAAAC CAGCCAAAGA AGAAAAAACA 
GATAGTAAAT CTGATTTAGA TAAATTAGTA GAAAATGCTG CAAGAGATGC CCTAGTTGAA 
ATAACAGCAA CTAAGGAAGT TGAAGCAAGC GAAGAAGCTC CAGCTGAAAA AGAAAAAGTT 
GAAGCTAAAG AAGAAGCTAG CGAAATAGCG GACAAAGAAG AAACTCACGA AGAAAAAGTT 
GAAGCTGCTA AGGGAAAAGA CAAAGACCTT ACCCTTGTAA AATACGTTAA TACAGAAATC 
CTTAACGTAA GAAGTAGCAA GGATATGGAT GAGAATAATA TCGTATCTTC CCTCAAGGCA 
GGAGATGAAA TAGAAGGAGT CCTAGAAGAA GGATTCCTAA AGACTGAATT AGGATATGTA 
AATGATGAAT TTCTTTCAGA TGTTTATCCT GTAGATTTAG TAAATGAATT AAATAATAAA 
GGAGAAGAAA AAGCCCAAGA AGTTGAAAAG CAAGAAGAAG CGAAAAAGGC TGAAGATGCA 
GAAAAAGCTC AAGAGGCTGA AGAAGCTAAG AAAGCTCAAG AAGCAAAGAA AGCTGAAGAA 
GCTAAGAAAG CTCAAGAAGC AAAGAAAGCT GAAGAAGCTA AGAAAGCTCA AGAAGCAAAA 
GAGGCTGAGG AAGCTAAGAA GGCTCAAGAA GCAAAAGAAG CCGAAGAAGC AAGAAAAGCC 
GAAGAAGCTA AGAAGGCTGA AGAAGCAAAA AAAGCTGAAG AGGCTAAGAA GGCCGAAGAA 
GCAAAAAGAG CTGAAGAAGA AAGACAAGCC CAAGAGGCTC AATCATACTA CTATACAGGA 
TGGGTTAACA CATCAGTCCT CAATGTTAGA AGTAAGGCAG GAGACGGCAG TATCATCGGA 
TCTGTTAGAA AGGGTGACTG GCTAGAAGGC GAGGCTAGTA ATGGTTGGCT AGCAATTGAC 
TATAATGGTC AAAAGGGATA TGTAGCAGCA GACTTCCTAT CTGACACAGA AGTAGCTAAG 
GAAGAAGTGA AAGAAGAAGC AGCTGAGGCT AACGAACAAG TCCAAGAAGT TGAAGAAGTT 
CAAGAAGTAG AACAAGCTTC AGCACCAGCC TATAATGGTT CTGGACTAGC AGCAGCAGAT 
CTTGCAACAC AATTCGTAGG AAGCCCATAC GTTTGGGGTT CTGCTAACCC AGGAGTAGGC 
TTTGACTGTT CAGGTCTTAC ATCTTATGTA TATGGCCAAA TGGGCATATC TATCCCACAC 
CAATCAGCAG CCCAATACTC AAGCGGATAC GCTGTAGATT CATCTAACCT TCAAGCAGGA 
GATCTTGTGT TCTTCTCTTA TGGTGGAGGT GGAATCGACC ACGTAGGAAT TGTAGTTAAT 
TCTGACGGTA CCTTCGTTCA CGCATCTACA CCTGCAACAG GTGTTAGATA TGACAATGTA 
TACAACGGTA GCTTCCAAAA CGCATTCGTT GGAGCTAGAA GGATATATTA G

Protein sequence

MKKKNIGAML SVIAAVTAGA SAYATTIDNL DQDQHTNSLI TEANYTESYS DYDLVKSEYT 
EDVKNTKIAK EDKPAKEEKT DSKSDLDKLV ENAARDALVE ITATKEVEAS EEAPAEKEKV 
EAKEEASEIA DKEETHEEKV EAAKGKDKDL TLVKYVNTEI LNVRSSKDMD ENNIVSSLKA 
GDEIEGVLEE GFLKTELGYV NDEFLSDVYP VDLVNELNNK GEEKAQEVEK QEEAKKAEDA 
EKAQEAEEAK KAQEAKKAEE AKKAQEAKKA EEAKKAQEAK EAEEAKKAQE AKEAEEARKA 
EEAKKAEEAK KAEEAKKAEE AKRAEEERQA QEAQSYYYTG WVNTSVLNVR SKAGDGSIIG 
SVRKGDWLEG EASNGWLAID YNGQKGYVAA DFLSDTEVAK EEVKEEAAEA NEQVQEVEEV 
QEVEQASAPA YNGSGLAAAD LATQFVGSPY VWGSANPGVG FDCSGLTSYV YGQMGISIPH 
QSAAQYSSGY AVDSSNLQAG DLVFFSYGGG GIDHVGIVVN SDGTFVHAST PATGVRYDNV 
YNGSFQNAFV GARRIY