Gene Arth_1002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1002
Symbol
ID	4446507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1081292
End bp	1082770
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	55%
IMG OID	639688808
Product	serine/threonine protein kinase
Protein accession	YP_830499
Protein GI	116669566
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCACGG GTTCGACAGT TGTTTTAGAT AACGGGTCTT GGACATTGTC GGATGAACTG 
GGACATGGTG GTTTTGGGGA GGTCTACCGT GGCCATCAGG GCGCGGTAGA GGCGGCAATT 
AAGTTCATAC CTAAAAGTAA AGGTGTTCCA AGAGAGATAT TGCTGGACAT CCCCAAAAAC 
GCTCGGAATG TCATCCCCAT CACGGGTACT GGCGAAGACG CAGATAACTG GATCATTTCA 
ATGCCGGTTG CGGACCATTC GCTTGAAAAG ATGCTTAACG CCCACGGCGG CAAGCTTCCT 
GAGGATCTAG CCGTCATGGT CCTAACCCAT ATTGCCGAGG CGCTTGCCAG CCTCGACGGA 
AGTATCGTCC ACCGGGACAT CAAGCCGGGC AACATATTAC TTTTCAACGC CAAGTGGTGT 
CTCACCGACT TTGGCATTGC CCGCTATGCT GCAGCAGCCA CGGGAAGCTT GACTCACAAA 
GGGTACGGAA CTGCAGCGTA CGTTGCTCCC GAACTGTGGC TCGGTCAAAG TGCAACAAGC 
CAGAGCGACA TCTACGCCCT AGGCATTGTG GCTTACGAGA TCATCACGGG GAGTCTTCCG 
TTCCAAGGAA CAGAAGCCGA AATCGCGCAC GGCCACTTGA ACGTTATTCC GCCTTCCACT 
GGTGCCCCGG CTCGGCTTGA CTGGGTGATC CTGGACAGTC TGAGTAAACC GCCATCACTT 
AGGCCCACTG CTGAACAATT CAAGGTAAAG CTCAGCCAGA GGGCTGCCGT TTTCAATTCA 
AAGGCCGCTA TGGCAATGGG GCAAGCTAAC CACGAGTTGA GGAGCTTGGA GGAACAGGCG 
GAGCAACGGT TGCGCCAGGC GGTAGCCGAA GCGGAACTAC GACAGCATCA CGTAGACCGC 
GCCGGGAAGT TGCTTTCCCG CATTGGGGAG GAAGTTCTGA CTACCCTCCA AGGCTTTGCT 
GATCGTGTGC AGTCCCAGCC ACAAAAAGAT GGGGGCGGAA AGTTGACCTT CCATAAAGCC 
TCCTTGATGA TCTCGCCCAT CATTCCGAAT ACCAACGGCC ATCTCATGGC GCAGGAAGAG 
GACCCCTTCG TTGTGCTGGC TACTGCCCAC ATCACTCTGT GGCAGTTTTC CGGGGTTAAT 
GGCTATCCCG GACGTTCGCA TGCGCTGTGG TATGCGGACG CAAAGGAAGA GGGCAATTTC 
CAGTGGTATG AGACCGCCTT CATACAAAAT GGCGGGATGC AGCCCACTCA GCGCTTTCGG 
CCGTTTGCCG CAGAGTTCGA GTCAAGGGAA GCCACGGCCG CACTCAGGGG AGAGGGCAAT 
TTCCTCGTTG CTTGGCCGTT TGCACCCCTT GATGCTGACG ACCTCGACGA GTTTATTGAA 
CGTTGGGGAG TTTGGTTCGC ACAAGCTTCT AAGGGGGAAC TGCAGGCAGA GCAAATCCAC 
AACATAGGTG ACATTCAGGA TTCTTGGCGT AAGGCTTAG

Protein sequence

MRTGSTVVLD NGSWTLSDEL GHGGFGEVYR GHQGAVEAAI KFIPKSKGVP REILLDIPKN 
ARNVIPITGT GEDADNWIIS MPVADHSLEK MLNAHGGKLP EDLAVMVLTH IAEALASLDG 
SIVHRDIKPG NILLFNAKWC LTDFGIARYA AAATGSLTHK GYGTAAYVAP ELWLGQSATS 
QSDIYALGIV AYEIITGSLP FQGTEAEIAH GHLNVIPPST GAPARLDWVI LDSLSKPPSL 
RPTAEQFKVK LSQRAAVFNS KAAMAMGQAN HELRSLEEQA EQRLRQAVAE AELRQHHVDR 
AGKLLSRIGE EVLTTLQGFA DRVQSQPQKD GGGKLTFHKA SLMISPIIPN TNGHLMAQEE 
DPFVVLATAH ITLWQFSGVN GYPGRSHALW YADAKEEGNF QWYETAFIQN GGMQPTQRFR 
PFAAEFESRE ATAALRGEGN FLVAWPFAPL DADDLDEFIE RWGVWFAQAS KGELQAEQIH 
NIGDIQDSWR KA