Gene Apre_0520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0520
Symbol
ID	8397297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	597139
End bp	598254
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	37%
IMG OID	644994879
Product	nuclease SbcCD, D subunit
Protein accession	YP_003152288
Protein GI	257066032
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGACTCC TCCACCTATC AGACCTACAT CTAGGAAAAA ATATCGGTTC GTATTTCCTA 
ATCGAAGAGC AAGGCTTTGC TCTAGCTGAG ATTATCAAAA TTATAAAAGA AGAAGATGTC 
GATATAGTGA TGATTGCAGG AGATATCTTC GATACTATTA TTCCAAGTGC GGAGGCCATG 
GATCTTTATT CTAACTTTAT CGAAGAGATA GTTTTTGATT TAGGAAAGAA GGTCCTAGCT 
GTTTCTGGCA ATCACGATTC ATCTAAGAGA CTTGATATCA ACAAGAGATT CTACAGGTCC 
AATAATTATT ATCTAGTAAG CGAATATGAC AAAGATCCTA TTAGCTTTGA GGATGATTTT 
GGGAAAGTTA ACTTCTATCT CATTCCCTTT ATTTCCATAA ATAAGGCGAA AACAATCTTT 
GATTCATCAA TAGATAATTT CACCGATGTC TATAAATATG CCCTAGAAGC TATTGACTAT 
AGGGATAGGA ATGTGCTTAT TACTCATTGC TACGCTTCAA ATATGAGTTC ATTTGACAAA 
GAAGTCTATG ACGAAGGTCA AAAGCCTCTT ACTATCGGAG GAACTGACGC CATGGATGCA 
AGTTTATTTG AAGGCTTCGA CTATGTAGCC CTGGGCCATC TTCATAGGGC TCACTACGTC 
TTAGACCCTA AGATCAGATA TTCAGGGACC TTTATGAAAT ATTCCTTCGA TGAGGAAAAT 
CTTACAAAAA CTGTAAGCCT AGTTGACCTT AAAGATAAGG CAGAAATAAG AAAAATCGAA 
ATCCCCTTCT TGAGGGACTT TGTTACAAAA AGGGGAATGT TTGAAGAAAT CTTAAAGGAA 
GAAAAGTCAG AGGATTATAT AAAATTTATC CTAGAAGATT CCTATATTCA CGAAAATGCC 
ATGGCAAGGT TAAAGGAGAA ATTCCCTAGG GCTGTCTCAA TCACTTACGC CAACAAGGCT 
GTATTTGAGA GGGAAGATAG TTACGATGTG GACATAGATG ACAAGAATTT GCTAGAGCTT 
TTTGCAGAAT TTTATCACTT CAAGATGGAT GAAGACCTTA AACAAAAAGA CACCCAACTT 
ATACAAAGGA TAGGCTTATG CGACCAAGAA GACTAA

Protein sequence

MRLLHLSDLH LGKNIGSYFL IEEQGFALAE IIKIIKEEDV DIVMIAGDIF DTIIPSAEAM 
DLYSNFIEEI VFDLGKKVLA VSGNHDSSKR LDINKRFYRS NNYYLVSEYD KDPISFEDDF 
GKVNFYLIPF ISINKAKTIF DSSIDNFTDV YKYALEAIDY RDRNVLITHC YASNMSSFDK 
EVYDEGQKPL TIGGTDAMDA SLFEGFDYVA LGHLHRAHYV LDPKIRYSGT FMKYSFDEEN 
LTKTVSLVDL KDKAEIRKIE IPFLRDFVTK RGMFEEILKE EKSEDYIKFI LEDSYIHENA 
MARLKEKFPR AVSITYANKA VFEREDSYDV DIDDKNLLEL FAEFYHFKMD EDLKQKDTQL 
IQRIGLCDQE D