Gene Acid345_1921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1921
Symbol
ID	4071032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2309746
End bp	2310777
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	63%
IMG OID	637983933
Product	transposase IS116/IS110/IS902
Protein accession	YP_590996
Protein GI	94968948
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.876079
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCG TAGCGGTCGG TATCGATCTC GGTAAAACCG TGTTTCACCT GGTGGCGATG 
GGAGAGCGCA ACCGCGTGCT GGTGCGGCGG AAGTTCTCGC GTCAACAGCT GTTGGCTTAC 
ACGGCCAACC TCGAGCCCAC TTTGATCGGC ACCGAAGCCT GTGCCGGCGC CCATTTTCTC 
GCGACAGCCC TATGTGCGCA GGGACACGAC GTGCGCCTCA TGGCAGCCCA GTTCGTGAAG 
CCTTACCGTA AGTCGAACAA GAGTGACTTT CTCGATGCCG AGACGATCGC CGACGCGGTG 
CAGAAGGAGA ACATGCGCTT CGTGCCAGTC AAGACCGACG AGCAACTCGA TCTGCAGGCT 
ATGCACCGCG TGCGCACTCG CCTGGTGCAG CGGCGCACGG CACTGATCAA CGAGATCCGC 
GGGTTCCTGC TGGAGCGCGG CATCATCTTT CCCGCGAAGC CGATTCACCT GCGCAAGCAA 
CTTCCGGGTG TACTGGAAGA CGCGACCCAG AACCTGACGC CGAGGCTGCG CTGGCTGCTC 
TCTGAACTTG CGGAGGAGTG GAAGGAGTTG GAAGCTAGGA TCATCGCTAT CAGCGACGCC 
ATCGAGCGGA TCAGCACCAG CGATCCACTC TGCCAGCGTC TGCGCCAGAT CCCAGGCTTC 
GGGCCGCTGG TTTCGACAGC AACCGTGGCC GCTATCGGCA ACGGGTCGTC GTTCCGCAAG 
GGTCGCGACT TCGCGGCGTG GCTCGGTGTT GTTCCCCGAC AGTACTCCAC GGGTGGCAAG 
ACGGCGCTCT ACGGCATGAG CAAACGCGGC AACCGTTATC TACGACAGCT GCTGATCCAT 
GGCGCGCGTG CTGTCCTGAT CCGGGTGAAG TACGACACCG CAGGGTTGGG GCAGTGGATC 
CACAAGCTGG CCGAGCGTGC ACCGCGCAAC AAGGTGATCG TCGCGATCGC CAACAAGCTG 
GCGCGTATCG CCTGGGCGGT ACTCGCGAAG GGTGAGCCTT ACCGCCATCA GCCCTTGGCG 
GCCGCAGCGT AG

Protein sequence

MRIVAVGIDL GKTVFHLVAM GERNRVLVRR KFSRQQLLAY TANLEPTLIG TEACAGAHFL 
ATALCAQGHD VRLMAAQFVK PYRKSNKSDF LDAETIADAV QKENMRFVPV KTDEQLDLQA 
MHRVRTRLVQ RRTALINEIR GFLLERGIIF PAKPIHLRKQ LPGVLEDATQ NLTPRLRWLL 
SELAEEWKEL EARIIAISDA IERISTSDPL CQRLRQIPGF GPLVSTATVA AIGNGSSFRK 
GRDFAAWLGV VPRQYSTGGK TALYGMSKRG NRYLRQLLIH GARAVLIRVK YDTAGLGQWI 
HKLAERAPRN KVIVAIANKL ARIAWAVLAK GEPYRHQPLA AAA