Gene Arth_0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0149
Symbol
ID	4447412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	153540
End bp	154670
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID	639687944
Product	tRNA(Ile)-lysidine synthetase
Protein accession	YP_829650
Protein GI	116668717
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG0037] Predicted ATPase of the PP-loop superfamily implicated in cell cycle control
TIGRFAM ID	[TIGR02432] tRNA(Ile)-lysidine synthetase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCCCACG CCCCAAGCGG ACGACGGCGG CCCGGCCGGT TGCCGCCCGT CGTCGGCAAG 
GCGCGCAAAA TGTTGCAGAA CGCCCTGGCC GAGGCCGGCT ACCCCGAACG GGTACTCGTC 
GCCTGCAGCG GCGGCCCGGA TTCCCTGGCC CTCGCGGCCG TCGCATCCTA CTTCGGCCGC 
CGCGGCCACG TGGACGGCCA CCCCGTGTCG GTGGGCGCCG TCGTCGTTGA CCACCAGTTG 
CAGCCCGGCT CCGCCGCCGT CGCCGCCCAA ACCGCCGACG TCCTCCGGGA CCTGGGGCTT 
TCCCCCGTGG ACGTGCGGCA GGTTGACGTC GCGTCGACCG GGATCGGCCC CGAGGCCGCG 
GCCCGGGACG CCCGCCACGC GGCCCTGGAG GAAGCAGCAG CCCAGGCCGG TGCCAATGTA 
ATCCTCCTCG GCCACACCCT GGACGACCAG GCGGAACAGG TGCTGCTCGG TCTCGCCCGG 
GGCTCCGGAA CACGCTCGCT GGCGGGAATG CGGCCCGTCC GCGGACTCCT GCTCCGGCCG 
TTCCTGGGCC TCCGCCGCGC CGACACCCTG GAGATCTGCG CGGTCGAAGG ACTGGACCCG 
TGGCGCGACC CCAGCAACGC CGACCCGTCC TTTGCCCGGT CACGGACACG CGTGGAGGTC 
CTCCCCATGC TGGAAGACAA GCTCGGTCCC GGCGTCGCGG AGTCCCTGGC CAGGACGGCC 
GCCATCCTGC AATTGGACGC CGACTACCTC GACGACGTGG CCAACAGCAC GTATGAGCAA 
CTGGCGGAGC AGTCCGGCGG GGAGATCAGC CTCCCCGAAG CTGCGCTGGG CGAGCTGGCC 
CCCGCCATCC GGTTCCGGGT GATTGCCAAG GCAGCCGCCG CCGTCGGAGG CCAGCAGCCG 
AGCTATCAGC GCCTGCTTGC CGCGGAGGCA CTCCTGCGCC GGCAGGGTTC CGCCGGCCCC 
GTGGAACTCC CCGGCGGAGT GAGCGCCTAC CGGCTGTCGC TGGCGCAAAT CCTCGCTGGC 
GAAGGGCAGA ATCCGCCGGG CCGGGCAGGA GATGCCGCCA ACGGCGGTCC CCGCGAAGCC 
GCGCGCTGTG GGAAGCTAGT ATTCCGGCCT CAAAAGCCGC CCCAAGAATA G

Protein sequence

MSHAPSGRRR PGRLPPVVGK ARKMLQNALA EAGYPERVLV ACSGGPDSLA LAAVASYFGR 
RGHVDGHPVS VGAVVVDHQL QPGSAAVAAQ TADVLRDLGL SPVDVRQVDV ASTGIGPEAA 
ARDARHAALE EAAAQAGANV ILLGHTLDDQ AEQVLLGLAR GSGTRSLAGM RPVRGLLLRP 
FLGLRRADTL EICAVEGLDP WRDPSNADPS FARSRTRVEV LPMLEDKLGP GVAESLARTA 
AILQLDADYL DDVANSTYEQ LAEQSGGEIS LPEAALGELA PAIRFRVIAK AAAAVGGQQP 
SYQRLLAAEA LLRRQGSAGP VELPGGVSAY RLSLAQILAG EGQNPPGRAG DAANGGPREA 
ARCGKLVFRP QKPPQE