Gene Acid345_3762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3762
Symbol
ID	4069337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4446015
End bp	4447154
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	60%
IMG OID	637985784
Product	phage integrase
Protein accession	YP_592836
Protein GI	94970788
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.288729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATAT CTCCCGTTGT CACGATCTTT GTCAGGCACT CCGCAGATTG CAAATATCAC 
GGGGAAGAGT TTGAGAAGCG CTGCCGTTGC CGCAAGCACC TCCGATGGAG CCAGAACGGA 
AAGCAGTACC GACGCAAGGC CGGGACGCGC TCGTGGGGAG AGGCAGAGAA CGTAAAGCGG 
GAGTTGGAGG CCCAACTCTC CGGGCGAGTC ACCGAGACGC CCGCCGCGCC CGAGCAACGG 
TTACTACCAG AGGCCACGGA ACTTTTTCTC AAGGACAAGA AAGTTCAAGG CGTGTCCAAG 
GGTGTGCTCG GCAAATACAC CCGAGAACTG GATCGGCTCC GGACCCACTG CGAACGAGCG 
GGCGTCTACA CTGCGCAAGG AATCACCCGC GAGTTGCTCA CCGAGTTTGC AGCGACGTGG 
GAGAGTGTGT ACCCGAGCAG TTCCACCCGT TCCAAGGTTC GCGAGCGCTG CCGCGCCTTC 
CTCCGTTACT GCTACGAGTG TCAGTGGATT CCGCGTATCC CGGCACTGCC CAAGATTCAA 
GTAGATGAGC CGGAGACGAT GCCCCTCACG GATGCGGAAT TTAAGCGGCT GCTTGACGCG 
ACGTATGCGG AAGTTTCGGA CACGGACCAG CGGGCAAGGG TTCACGCGCT CTTTCAACTC 
ATGCGCTGGA GCGGTCTAGC GATTGGAGAC GCACTCCGGC TGGAGCGCTC GAGAGTCATC 
CACGACGAAG GGAAGGGTGT GCACCGCGTT GTCACCGCTC GGCAGAAAAC CGGAACGCCC 
GTGTCCGTGC CGATCCCGCC CGACGTTGCG GAGGAAGTGC TCAAGGTGCT GAACGGAAAT 
CCTCGCTACG TGTTTTGGAG TGGAAAGGGC GAGCCCGAGA GCATCTCGAA AAATTGGTCC 
AAGTACTACG TTCGCCCGTG CTTCGAGGGA GCGAAGATCG AGAGCAACGG GAACATGATG 
TCCCATCGCC TCCGAGACAC ATTCGCGTGT GACCTCTTGC AGAAGGGTGT GCCGTTGGAG 
GAAGTGTCCA AGCTGCTCGG GCACGAGAGC ATCAAGACCA CAGAGAGAAG CTATGCGAAA 
TGGATTCAGG CGCGTCAGGA CCGGCTCGAC ACGCTCGTGA TGACGACGTG GGCCAAGTAG

Protein sequence

MTISPVVTIF VRHSADCKYH GEEFEKRCRC RKHLRWSQNG KQYRRKAGTR SWGEAENVKR 
ELEAQLSGRV TETPAAPEQR LLPEATELFL KDKKVQGVSK GVLGKYTREL DRLRTHCERA 
GVYTAQGITR ELLTEFAATW ESVYPSSSTR SKVRERCRAF LRYCYECQWI PRIPALPKIQ 
VDEPETMPLT DAEFKRLLDA TYAEVSDTDQ RARVHALFQL MRWSGLAIGD ALRLERSRVI 
HDEGKGVHRV VTARQKTGTP VSVPIPPDVA EEVLKVLNGN PRYVFWSGKG EPESISKNWS 
KYYVRPCFEG AKIESNGNMM SHRLRDTFAC DLLQKGVPLE EVSKLLGHES IKTTERSYAK 
WIQARQDRLD TLVMTTWAK