Gene Arth_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0020
Symbol
ID	4447523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	23164
End bp	25062
Gene Length	1899 bp
Protein Length	632 aa
Translation table	11
GC content	66%
IMG OID	639687813
Product	serine/threonine protein kinase
Protein accession	YP_829521
Protein GI	116668588
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACACCC AGCGCGTCCT CAACGGACGG TACGAACTCG GTGAGCTGAT CGGCCGCGGC 
GGTATGGCGG ACGTCCACCG GGGCCTGGAC ACCCGACTGG GCCGGACAGT GGCCATCAAG 
CTGCTGCGAC CGGACCTTGC CCGGGATCCA CAGTTCCAGG CGCGGTTCAA GCGCGAAGCC 
CAGGCCGTGG CCGCGTTGAA CCATCCTTCG ATCGTTGCCA TCTACGACAC GGGGGACCAC 
GCAGTGCCGG GCGGTCCCGA GGACACTGTC CGTGTGCCGT ACATCGTGAT GGAATTCGTG 
TCCGGAAAGA CCCTGAGGGA TCTCATCCGT GCGAAGGAAG TCAGCATCGA CCACGCCATC 
GACTTCACGC TCGGCGTGCT CTCCGCCCTC GAGTACAGCC ACCGGGCGGG AATCGTACAC 
CGGGATATCA AGCCCGCCAA CGTGATGTTC TGCGAAGACT CGGACACCAT CAAAGTCATG 
GATTTCGGGA TTGCCCGGGC CATGGCCGAT TCGTCCGCCA CCATGACCCA GACCCAGGCG 
GTCGTGGGCA CGGCGCAGTA TCTCTCTCCG GAACAGGCCC GCGGTGAAAC TGTGGACGCC 
CGGAGTGATC TCTACTCCGC GGCGTGCCTG CTGTACGAAA TGCTGACGGG AAGGCCCCCG 
TTCATCGGTG ACAGTCCCGT ATCAGTCGCC TACCAGCACG TCCGCGAGAT TCCGGAACCG 
GCCAGCAGCC TCAACCCCGA GGTGTCAGAG GCCCTGGACA GCGTCCTTTC GAAGGCCCTG 
CAGAAGAACC GTGCTGACCG TTTCCAGGAT GCGGCCGCAT TCCAGCGGGC ACTCCGGGCG 
GCCCGCAACG GCATCCCCGT GCCTGATGTG GCGGCGGGCG AGGCCCCGAC AGATCCCAAC 
AACACGGTCC CGGCCGGGGA ACGGACGGCC CTCGCCGCGC CTTACTCGCT GACGGGGGCA 
AGCTTCCTCG ATGATTCACC GAGCGGCCGG CTGCGGCCCG TCCATGACAC CCTTGGCGAC 
GACCAGGCGA TTCCGGCGCA GGTTTATGAG CCCTCGGAAT CCAGTGATCT TCCCCTCGGG 
TTTCCGCCGG AACGTGAGCG CACCCCGCGG CAGAAATCCC GCCGTCGAAC CTGGATTGCC 
ACGTTGGTGA TCTTCACCCT GCTGGTGCTG GCCGGCGGCG GCCTCTGGCT CTACAACATG 
ATGAACCAGG CGCCCCCTCC GGTGGCGAAG GTAGAGGTGC CGGCCGTATC GTCGCTGACG 
GAGTCCGAGG CGCTTCAGCG GTTGTACAAC GCCAGGCTGA GCCCGCAGAT CACCAGGTTG 
CCGCACGACA CCATCACCAA GGGCACGGCC ATCGGCACGG TGCCGGCCGC CGGCACCGCC 
ATGGAACCGG ACTCGAAGGT AACCCTGAAC ATCTCCGACG GCCCGAGCGC CGTCAAAATC 
CCGGATGATC TGCCGGGGCG GACCGAAGCG GCGGCCCGGG ACGTTCTTCG CCAGATCGGC 
CTCGCCGGCG CCCCCGGAAC CACCATGGCC AACAGCGCCA CCGTTCCCAC CGGAATCGTG 
ATCACCACCA AGCCGGCGCC GGGTCAGACC GTCGCAGTCG GAAGCACCGT GGAAATCGTG 
GTGTCCACCG GCAAGGTGGC CATGCCCGAA CTCCGCGGGC TGCCCAGGGC GGAGGCGGAG 
ACGGCACTCA AGAACCTGGG CCTTGGCATC GATGTGAAGG AAGTCGAAAA CTCCGAAGTT 
GAACCGGGGA AGGTCACCGA GCAGAGCGAC GCCGTCAACT CGCTGGTGGA GCAGGGCAAA 
ACCATCTCCA TTATCGTCGC CAAGGCGCCG GCGCCCAGCC CCAAGCCGAC TCCAACGCCG 
ACGCCCACGC CTACCGAGAC GAGCCGGGAC CGGGGATAG

Protein sequence

MNTQRVLNGR YELGELIGRG GMADVHRGLD TRLGRTVAIK LLRPDLARDP QFQARFKREA 
QAVAALNHPS IVAIYDTGDH AVPGGPEDTV RVPYIVMEFV SGKTLRDLIR AKEVSIDHAI 
DFTLGVLSAL EYSHRAGIVH RDIKPANVMF CEDSDTIKVM DFGIARAMAD SSATMTQTQA 
VVGTAQYLSP EQARGETVDA RSDLYSAACL LYEMLTGRPP FIGDSPVSVA YQHVREIPEP 
ASSLNPEVSE ALDSVLSKAL QKNRADRFQD AAAFQRALRA ARNGIPVPDV AAGEAPTDPN 
NTVPAGERTA LAAPYSLTGA SFLDDSPSGR LRPVHDTLGD DQAIPAQVYE PSESSDLPLG 
FPPERERTPR QKSRRRTWIA TLVIFTLLVL AGGGLWLYNM MNQAPPPVAK VEVPAVSSLT 
ESEALQRLYN ARLSPQITRL PHDTITKGTA IGTVPAAGTA MEPDSKVTLN ISDGPSAVKI 
PDDLPGRTEA AARDVLRQIG LAGAPGTTMA NSATVPTGIV ITTKPAPGQT VAVGSTVEIV 
VSTGKVAMPE LRGLPRAEAE TALKNLGLGI DVKEVENSEV EPGKVTEQSD AVNSLVEQGK 
TISIIVAKAP APSPKPTPTP TPTPTETSRD RG