Gene Acid345_3751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3751
Symbol
ID	4069326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4426717
End bp	4427763
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	64%
IMG OID	637985773
Product	transposase IS116/IS110/IS902
Protein accession	YP_592825
Protein GI	94970777
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTA TAGGCTGCGA TTTGCATGCA CGACAGCAGA CGATTGCGAT GCTGGACGTG 
GAAACGGGCG AACTCGAAGA GCGCCGCCTT GAGCATGAAG GCGACCAGGT GCGGGCGTTC 
TATGCGGGAC TACCGCGACC GGTGCGGGTG GGCATAGAAG CGACCGGCGC GATGCAGTGG 
TTTCTCGAGT TGATGGAAGA GCTCGAAGTG GAGTGCGTGG TTGGACATCC GGCGCAGATC 
CGTGCCGGGG AGCCGCGCAA ACAGAAGAAC GACCGTCGCG ACGCGCGATT GTTGCTGCGG 
CTGCTGGCGG AGAACCGGTT CCCGAAAATT TGGATGCCCT CGATGGAGCA GCGCGACGTG 
CGCGCCCTGC TGCGACATCG TGAGCAGTGG GTGCGGATTC GCGTGCGGCT GCAGAATGCG 
TTGCAGTCGA TCGCGCTAAC GCATGGGATT CGCCGCGGCG CGAGTTTATG GAGCAAGGCC 
GGGCAGCGGA CGATAGGCGA GCTAGCGTTG CCGCCGCTCA GCGGCATGCG GCGCGACGAA 
CTGATGCGGT TGCGCGTGCA ACTGCATCAG GAGATCGAGC GGCTGGATAA AGAAGCCGAG 
CGCGTGGCAC GAGAGCGTCC GCTGGCACGG CTGTTGATGA CGCATCCGGG CGTAGGGCCG 
ATCACATCGC TGGCGACGGA GGTGTTCCTC GGCGATGCAA CCCGCTTCGC AGATGGCAAG 
GCAGTGGCCA GCTACGTGGG CATGATCCCG TGCGAGCACT CGAGCGCGGG CAAGCAGCGC 
CTGGGCAAGC TCACGAAACA AGGCAACGCC ATGCTGCGCA TGCTGTGGTG CGAAGCGGCG 
CGACATGCCG TGATCAAAGA CGAAGATCTA CGGCGCTTCT ACCGTCGCAA GCTGGCGCAG 
AAGGGCCTGG GGATCGCGCT GGTAGCAGCC GCACGCAAGC TGGGAGTGCG GTTGTGGATC 
ATGCTGCGCG AAGAAATCGA CTACGAAGAG TTCTGCCGTC GCGGACGGCA GCGCGGGGAA 
GCCCAAGCGG AGAGGCCAGC TCGATAA

Protein sequence

MRIIGCDLHA RQQTIAMLDV ETGELEERRL EHEGDQVRAF YAGLPRPVRV GIEATGAMQW 
FLELMEELEV ECVVGHPAQI RAGEPRKQKN DRRDARLLLR LLAENRFPKI WMPSMEQRDV 
RALLRHREQW VRIRVRLQNA LQSIALTHGI RRGASLWSKA GQRTIGELAL PPLSGMRRDE 
LMRLRVQLHQ EIERLDKEAE RVARERPLAR LLMTHPGVGP ITSLATEVFL GDATRFADGK 
AVASYVGMIP CEHSSAGKQR LGKLTKQGNA MLRMLWCEAA RHAVIKDEDL RRFYRRKLAQ 
KGLGIALVAA ARKLGVRLWI MLREEIDYEE FCRRGRQRGE AQAERPAR