Gene Acid345_0279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0279
Symbol
ID	4068823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	289200
End bp	290567
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	62%
IMG OID	637982280
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_589358
Protein GI	94967310
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.86893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTTA GCGACCAGCT TGGGTTCACC TTTTCAGCTC CGCAGCGGCG GATTTGGCAG 
GTGCGCGACA TTGTGAGTGC GGTGCGCGCG GCGCTGGAGC GCGAGTACGC CGATGTATGG 
GTGGAGGGCG AGATTTCGAA CTTTCGCCCG GCGGATTCTG GACATCTTTA TTTCTCACTG 
AAAGATGAAT CGACGCAGTT GCGGATCGTA ATGTTCCGTT CGCAGGCGCG GCTGTTGAAG 
TTCCGCCCCG AGAATGGGCT GAAGGTAATC GCGCGCGGAA AAGTCACGCT CTACGAGGGG 
CGCGGCGAAC TGCAACTGAT GGCCGAGTAC CTGGAGCCTC AGGGTGCCGG TGCGCTACAA 
ATCGCGTTCG AGCAGCTTAA GGCGAAGCTG CAGGCAGAAG GATTGTTCGC GCGTGAGCGC 
AAGAAGCCGA TTCCGGCACT GCCGAAGAAG ATTGGCGTGG TGACTTCGCC GCGCGGAGCG 
GTGATTCAGG ACATTCTCAA TGTGCTGCGA AGGCGGCACA ACAGCGTGCA CGTGCTGATC 
TTCCCGGCAC AGGTGCAAGG CGAGACCGCA GCGTCGGAAG TTGCCAGCGG CGTGCGGTAT 
TTCAATAAGG CGGCGAATGT CGAGGTGATC ATCGTGGCGC GCGGTGGCGG CTCGATCGAA 
GATCTAGCGG CGTTCAACGA CGAGGGGCTG GCGCGGTCGA TTGCGACGTC GACGATTCCG 
GTAATTTCAG CGGTGGGCCA CGAGACGGAC TTCACGATCT GCGATTTCGT GGCGGATCTG 
CGGGCGCCAA CGCCGTCGGC TGCAGCCGAA TTGGTGATTC GCTCGAAGCA GGAAGTGGAT 
GAGCGGCTGA CGGCGCTAAG CACCCATTTG GCGCGGGCGT TGCGGGTTCG GCTCCTGGAA 
TACGAAAAGA AGTTGGACCG GTTGGCGCGG CATGGGGCGT TTGGCGGGAT GCAGACGGCC 
ATCGCGCGTC GGCAGCAGCG GGTGGACGAC CTTGCCTTCA GGCTCTCCGT GGCGCAAACA 
AATGTCTTCC GGCAACTGCA TCGGCGGCTG GACGTGGCTT CCACGCGGGT GCGGCACCAT 
GATTTGCGGA GCCGATTTGC GGCCGAACAT CGCGAACTGA GTGCCCGGGT GGAGAAGTTG 
GCTGCCACGT TGCGCGCGAA TCTAATGCGG CGGCGCACGC GAATTGAGCG GCTCGCGGGG 
CAACTGCAAG GGCTCTCCCC GATCTCTATT CTGGAGCGCG GCTACGCGCT GGTCTTTGAT 
GCCGAGGGGC GTTTGCTCAA AGACGCTCGG CAGGTGCGCG AAGGTAACAC GATCCGTGCA 
CAACTGGCGC TGGGGCAAAT CAGTGCGGTA GTGAAGAAGC CGGAATAG

Protein sequence

MSFSDQLGFT FSAPQRRIWQ VRDIVSAVRA ALEREYADVW VEGEISNFRP ADSGHLYFSL 
KDESTQLRIV MFRSQARLLK FRPENGLKVI ARGKVTLYEG RGELQLMAEY LEPQGAGALQ 
IAFEQLKAKL QAEGLFARER KKPIPALPKK IGVVTSPRGA VIQDILNVLR RRHNSVHVLI 
FPAQVQGETA ASEVASGVRY FNKAANVEVI IVARGGGSIE DLAAFNDEGL ARSIATSTIP 
VISAVGHETD FTICDFVADL RAPTPSAAAE LVIRSKQEVD ERLTALSTHL ARALRVRLLE 
YEKKLDRLAR HGAFGGMQTA IARRQQRVDD LAFRLSVAQT NVFRQLHRRL DVASTRVRHH 
DLRSRFAAEH RELSARVEKL AATLRANLMR RRTRIERLAG QLQGLSPISI LERGYALVFD 
AEGRLLKDAR QVREGNTIRA QLALGQISAV VKKPE