Gene Acid345_4384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4384
Symbol
ID	4073290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5197112
End bp	5198131
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	58%
IMG OID	637986417
Product	transposase IS116/IS110/IS902
Protein accession	YP_593458
Protein GI	94971410
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATTG TAGGGTGTGA TTTCCATCCT GGCTGGCAAC AAGTTGCCGT TTTCGATTCA 
GAAACCGGCG AGATCAGAGA ACTGAGGCTG CACAACGAGA GCGGTGAGGC CGAGCGCTTC 
TATCGTTCGC TTCCGGTGCC AACGTTGGTC GGGCTTGAGG CGTGTGGCAA CACGCAGTGG 
TTCGAGGATC TGCTCGATCG TTTGGGACAC GAAGTGTGGA TCGGGGATGC GGCAGCGATT 
CGCGCCAGTT ACGTGCGCAA GCAGAAGACG GATCGACGCG ACGCTGGGCA CATTCTCAAG 
CTGCTGATCG AGGGCCGCTT TCCTCGACTG TGGCGACCTA GTGCGGCGGA GCGCGATGTG 
CGGCAGTTGC TCATTCATCG CGATCGCCTG GTCGGCATTC GTTCCCGCGT TAAAAACGGA 
CTGCAGCACT TGATGCTGAA CAAGGGCAGG CAGATGAAGT TCAAGCTGTG GAGTGAAGCC 
GGCCAACAGC AGCTCCGAGA GTTGCCGCTC GAAGGATGGG CAGCACAACG ACGGAAAGAC 
CTGCTGCATT TACTCGGGCA GATCACCCCG TTGATCGAAG AGCTGAATCG TGCAGTGGAG 
CAGGCCGCCT ATGCAAATGA ACGTGCACGG TTGCTGATGA CACAACCGGG AGTCGGTCCG 
ATCACGGCGC TTGCATACGT TCTGACGATG GGCGATGTCT CGCGGTTCAA GCGCGGCAAG 
CAAATCGGCA GCTATCTAGG GCTGATTCCA TCCGAACACA GCTCGAGCAA GCGGCGCCGA 
CTGGGATCGA TCAGCAAACA AGGCAGCCCG TTCCTCCGCA TGTTGCTGGT GGAGAGCGCG 
CAAACGGTGA CCCGCTTGGA CGAAGGATTT CGAAAGCAGT ATCAACATCG CTGTCACCGC 
AAGATGAAAG CCGTAGCTAA AGTGGCGGCA GCGAGAAGGT TAGCCGTGCG ACTCTACTGG 
ATGCTGCGTA GCAACACAGC GTATCCGGAG ATCGCTCGCA TCGAGGGCAG CCCGAGGTAA

Protein sequence

MMIVGCDFHP GWQQVAVFDS ETGEIRELRL HNESGEAERF YRSLPVPTLV GLEACGNTQW 
FEDLLDRLGH EVWIGDAAAI RASYVRKQKT DRRDAGHILK LLIEGRFPRL WRPSAAERDV 
RQLLIHRDRL VGIRSRVKNG LQHLMLNKGR QMKFKLWSEA GQQQLRELPL EGWAAQRRKD 
LLHLLGQITP LIEELNRAVE QAAYANERAR LLMTQPGVGP ITALAYVLTM GDVSRFKRGK 
QIGSYLGLIP SEHSSSKRRR LGSISKQGSP FLRMLLVESA QTVTRLDEGF RKQYQHRCHR 
KMKAVAKVAA ARRLAVRLYW MLRSNTAYPE IARIEGSPR