Gene Acid345_4275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4275
Symbol
ID	4071847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5078992
End bp	5080173
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	57%
IMG OID	637986307
Product	phage integrase
Protein accession	YP_593349
Protein GI	94971301
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0146194
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAGGA ACGGAAGGCA TCAAGAAGGT CAAGTTTTTC GCAAAGGAAG TGGTTGGTAT 
CTTCGCTATC GCGAATCGGA ACACCAGCCG GACGGTTCAG TAAAACGGGT GCAGAAGTGC 
AAAAAGTTGG CGGACTACGG TGGCGCTCTT CGAACGAAGA GCTCCGTCCG GGTTCTGGCT 
GACGAGTTTC TTTCACCCCT CAACAACGGA ACAATCACGG TAGGCAGCAG CATGAGCCTG 
ACAGACTTCA TCGAAAAACG GTATCTGCCG TACATCAAGG AGCACAAAGC TCCCAGCACG 
TACGCCGGCT ACAAGAATCT TTGGAGTCTG TACATCAAGG AGCGCGGGAC GTCAGCGCTC 
CGCGATTACC GCACCTGCGA GTGCGAGGAC ATGCTCCTGG AAATCGCTCG GGCCCATGAC 
ACCGCGAAGG AAACGATCAA GCGCGTGAAG TCGTTCTTAT CGGGAACGTT CCGCTATGCC 
AAGCGCCAAG GCGTCTTGCA TACGGAAAAC CCGATGTGGG ACACCGTGAT CCCAGAATGT 
CGCGAAGGTG AGGAGACATA CGCATACTCG CTTCACGAAA TCCTGCGGAT GCTGGAATTG 
GTTCCGGAAC CTGCGGCCTC GATGATCGCG GTCGCAGGAT TTGGCGGCTT GCGGAGCGGA 
GAGATCCGCG GATTGCTGGT GGAGCACTAC AACCATGACT CGATCTTCGT CGCACAGTCA 
GCATGGCGGT CCCAGGTAAA GAAGGTGAAG ACCAAGGCGA GCAAGGCGCC GGTCCCAGTC 
GTCTCACAGT TAGCGGCGCG GATTGATGCA CATCTCAAGA CAATGGGTTC GCCGGCCAGC 
GGCTTCATGT TTCCGAACGC CGTCGGCAAG CCGATCGGGA TGCAACGTGT GGCGGATGAA 
GTCATTCGCC CAGCGCTCAA AGGCTCTGGC ATCGAGTGGC ACGGCTGGCA TGCACTGCGT 
CGCGGATTGG CAACGAATCT CCACGGCTTG GAAGTGCCGG ACAAGATCAC GCAAATGATC 
CTCCGTCACT CGAGTGTTTC CGTGACGCAG AGCTGCTACA TCAAAACCGT TGATTCGCAG 
GCGGTTAAGG CGATGCGGAA ATTGGAGTGT GCAACTACTG TGCAACTGGC GAAGGCACAG 
CGGGAAGCAA CTCCCGAGGT TTCGTCACCG AGGATTATGT AA

Protein sequence

MKRNGRHQEG QVFRKGSGWY LRYRESEHQP DGSVKRVQKC KKLADYGGAL RTKSSVRVLA 
DEFLSPLNNG TITVGSSMSL TDFIEKRYLP YIKEHKAPST YAGYKNLWSL YIKERGTSAL 
RDYRTCECED MLLEIARAHD TAKETIKRVK SFLSGTFRYA KRQGVLHTEN PMWDTVIPEC 
REGEETYAYS LHEILRMLEL VPEPAASMIA VAGFGGLRSG EIRGLLVEHY NHDSIFVAQS 
AWRSQVKKVK TKASKAPVPV VSQLAARIDA HLKTMGSPAS GFMFPNAVGK PIGMQRVADE 
VIRPALKGSG IEWHGWHALR RGLATNLHGL EVPDKITQMI LRHSSVSVTQ SCYIKTVDSQ 
AVKAMRKLEC ATTVQLAKAQ REATPEVSSP RIM