Gene Arth_1780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1780
Symbol
ID	4445679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1991930
End bp	1993606
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	64%
IMG OID	639689598
Product	transposase
Protein accession	YP_831270
Protein GI	116670337
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.466747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGTCAA GAGTGGAGTT GTTCGCGCAG ATTCGGAGGG ATGCCCGGGT GGAGGGCGCG 
TCAATCCGGG AGCTTGCCCG CAGGCACCAG GTGGCGCGGA AAACCGTGCG TAAGGCGTTA 
AGTTCCCCGG TCCCGCCAGA GCGTAAAACT CCTGTACGGT CCTCGCCGCG GCTTGATCCT 
TATAAACCGA CGATCGACGC CATGCTCGTC GAGGACACGA CGGCGCCGAG GAAGCAGCGT 
CACACTGCCC GGAGGATTCT TGCCCGGCTC ATCGAGGAGC ATGGAGCGGA CGAGTTGTCG 
TATTCGACGG TGCGTGACTA CGTTCGGGTC CGCCGGGCGC AGATCGATGT GGAGGCCGGC 
CGCCGGGTTG AGGTATTTGT TCCTCAGGAG CACGCCCCGG GCGCGGAAGC GGAAGTGGAC 
TTCGGTGAAG TCTGGATCGT GCTGGACGGG GTAAAGACGA AATGCCACAT GTTCATCTTC 
CGGCTTTCTC ACTCCGGCAA AGCCATCCAC CGGATTTACC CCACCCAGGC CCAGGAAGCG 
TTTCTGGAAG GCCACGTCGA GGCGTTCAAC GAGATCGGCG GCGTGCCGGT CAAACATATC 
CGCTATGACA ACCTCACCAG TGCCGTCAGG GCCGTGGTGT TCGGTCAGGG GCGGAACCGC 
CTGGAGAATG ACCGGTGGGT GTTGTTTCGC TCGTTCTATG GATTTGATGC CTTTTATTGC 
CAGCCAGGTC TTGCCGGCGC TCACGAGAAA GGCGGGGTCG AGGGCGAGGT GGGCTGGTTC 
CGCCGCAACC GGCTGACCCC GATGCCCGTG GCGAGGTCCC TTGATGAGCT CAACGACTGG 
ATCCGGAGCC GGGAGGTTCA AGACGATCAG CGGCGGATTG ATGGCAGGAT CCGCACTATC 
GGCCAGGACT TCGCCGCCGA GCGCCCGTTC CTGGCACCGT TGCCGGCCGA CGAGTTCGAT 
CCCGGTCTGG TGTTGAACCC GAGAGTGGAC CGGTCCTCAA TGATCACCGT GCGGATGGTG 
AAGTACTCGG TGCCAGCACG GTTCATCGGT CGGCGGGTCC GGGTTTCATT GCGGGCATCC 
GAAGTTGTGG TGTTCGACGG CCGCGCGGTG GCGGCCCGGC ACCAGCGGAT TATTGCCAAG 
GGCGGGCAGT CGGTCCAGTT GGACCATTAT CTGGAGGTCC TCAAGACCAA GCCCGGCGCT 
TTGCCTGGTT CCACTGCTTT GGCCAGGGCG CGGGAGTCGG GTGCTTTCAC CAGCGCCCAT 
GACGCCTTCT GGTCTGCCTC GCGCAGGGTC AACGGTGATG CCGCGGGGAC CCGTGAACTG 
ATTGACGTCC TGCTGCTGCA CCGATCGATG GAAGCCGAAG ACATCGAGGC AGGGATCACC 
GCAGCCCTTG GAGTAGGTGC CGTCAGTGCC GACGTCGTGG CGGTTGAAGG CCGCCGACAT 
GCCTCCAGCA TCCCTGCTGG TGGGTCCCGT CCTGACCGTC ATCGCGGTGC TCATGCTGAA 
GCGAAAGTGC AACGAGTTGT CAGCCTGACC CAGCGCCGGC TGATGGACCC GGCGGCGGTC 
ATCGCCGGGC TCCCTCCAGA CAAGCGGCCG CTCCCGGCGA TCAGCGCCTA TGACGAGCTG 
CTGGCCAAAC GCACCGAACA CTCCGCAGGA ACCGCGTCGA AGGAAAACAT CTCATGA

Protein sequence

MGSRVELFAQ IRRDARVEGA SIRELARRHQ VARKTVRKAL SSPVPPERKT PVRSSPRLDP 
YKPTIDAMLV EDTTAPRKQR HTARRILARL IEEHGADELS YSTVRDYVRV RRAQIDVEAG 
RRVEVFVPQE HAPGAEAEVD FGEVWIVLDG VKTKCHMFIF RLSHSGKAIH RIYPTQAQEA 
FLEGHVEAFN EIGGVPVKHI RYDNLTSAVR AVVFGQGRNR LENDRWVLFR SFYGFDAFYC 
QPGLAGAHEK GGVEGEVGWF RRNRLTPMPV ARSLDELNDW IRSREVQDDQ RRIDGRIRTI 
GQDFAAERPF LAPLPADEFD PGLVLNPRVD RSSMITVRMV KYSVPARFIG RRVRVSLRAS 
EVVVFDGRAV AARHQRIIAK GGQSVQLDHY LEVLKTKPGA LPGSTALARA RESGAFTSAH 
DAFWSASRRV NGDAAGTREL IDVLLLHRSM EAEDIEAGIT AALGVGAVSA DVVAVEGRRH 
ASSIPAGGSR PDRHRGAHAE AKVQRVVSLT QRRLMDPAAV IAGLPPDKRP LPAISAYDEL 
LAKRTEHSAG TASKENIS