Gene Arth_1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1766
Symbol
ID	4445700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1977360
End bp	1978424
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	63%
IMG OID	639689585
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_831257
Protein GI	116670324
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0961431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACA ACGCGCAGAC GACGCAAGCA GTGATCGTCA TCGGAGGCAT CGATGCGCAC 
GCCGACACTC ATCATGTCGT CGCGCTCGAT ACGACCGGGA AGATACTCGG CGACCACCCT 
TTTCCCGCTT CATCACGCGG ATATCGTGAC GCGCTGGACT GGTTGGCAAA GTTCGGGTTG 
ATTGACAAGA TCGGAGTCGA ATCCACCGGT TCGTATGCGG CCGGCATCAC ACGGTTCCTC 
CTCGAATCAG GTGTCGATGT CGTGGAAGTC AACCAGCCAC ACCCGCACCT GAGGGCGCGC 
CGCGGCAAAG ACGATTCGAT CGACGCTGAA GCAGCAGCGC GCAAAGCGCT CTCGGGGCAG 
GCCACCGCGA TCCCGAAGGT CACCACGGGT GTTGTCGAGT CTTTCCGTGT GCTGCGCTTG 
GCCCGGGAAT CCGCCGTTCG TTCCCGCACG AGAACGATCG TGCAACTGCG CAGTCTTCTA 
GTCACAGCAC CTGCGCGGCT GCGGGAGCAG CTCACGGAAC GGTCCGCAGC CGTGCTCGTG 
GCACGATGCG CGGGCTTGCG GCCTGATCTG GATCGTCTTG ATGACCCCCT TCAAGCCACC 
AAGCGTGCAC TGCGCGCCAT GGCCCGGAGG ATCCAGATGC TCGATGAGGA GATCAACGAG 
ACCGACGCCT CACTCAAACA GCTCGTCGAG CGCACCGCGC CGACTCTGAC GTCCAAGCTC 
GCGATCGGGC CAGGGCACGC CGCGCAGCTG TTGATCACCG CCGGGCAGAA CATTGAGCGG 
CTCCACTCCG AGGCCGCATT CGCCAGACTC TGCGGCGTCG CACCGATCCC GGTCTCCTCC 
GGCAAGACGC ATCGCATGCG CCTGCACCGA GGCGGTGATC GTCAAGCCAA CGCCGCGCTC 
CACATGATCG CGGTCTGCCG GATGCGCTAC CACCAGCCCA CCATCGACTA CGTCAAGCGA 
CGCCTCTCTG AAGGACTGTC GAAGAAGGAC GTGCTCCGAT GCCTCAAACG ATTCATTGCC 
CGGGAGGTCT ACCACGACCT GAAAACCGAC CTTGGACTCA CTTGA

Protein sequence

MSNNAQTTQA VIVIGGIDAH ADTHHVVALD TTGKILGDHP FPASSRGYRD ALDWLAKFGL 
IDKIGVESTG SYAAGITRFL LESGVDVVEV NQPHPHLRAR RGKDDSIDAE AAARKALSGQ 
ATAIPKVTTG VVESFRVLRL ARESAVRSRT RTIVQLRSLL VTAPARLREQ LTERSAAVLV 
ARCAGLRPDL DRLDDPLQAT KRALRAMARR IQMLDEEINE TDASLKQLVE RTAPTLTSKL 
AIGPGHAAQL LITAGQNIER LHSEAAFARL CGVAPIPVSS GKTHRMRLHR GGDRQANAAL 
HMIAVCRMRY HQPTIDYVKR RLSEGLSKKD VLRCLKRFIA REVYHDLKTD LGLT