Gene Arth_2392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2392
Symbol
ID	4444975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2679295
End bp	2680890
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	68%
IMG OID	639690202
Product	multifunctional hydroxymethylpyrimidine phosphokinase/4-amino-5-aminomethyl-2-methylpyrimidine hydrolase
Protein accession	YP_831871
Protein GI	116670938
COG category	[H] Coenzyme transport and metabolism [K] Transcription
COG ID	[COG0351] Hydroxymethylpyrimidine/phosphomethylpyrimidine kinase [COG0819] Putative transcription activator
TIGRFAM ID	[TIGR00097] phosphomethylpyrimidine kinase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0171536
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCCTT TGGCCTCATC ATTCCTGCCC ACCCCTGCCT CCGAAGTCGC CCGCGAATCA 
TCACCGGGCG GCACTGTCCT GCGCAGTACG CCCCGGGTCC TGGCCATCGC CGGCTCCGAT 
CCGTCCGGCG GGGCGGGGAT CCAGGCCGAC CTCAAAAGCA TTGCCGCAAA CGGCGGATAC 
GGCATGGCTG CCATCACCGC CCTGACGGCG CAGAACACCC GTGGCGTTCG TGCCGTGCAC 
GTGCCCCCGG CGGATTTCCT GACGGCCCAG CTTGAAGCCA TCAGCGACGA CATCAGCATT 
GACGCCGTCA AGATCGGCAT GCTGGGTGAC TCTTCGGTGA TCGCCGCTGT CCGCAGCTGG 
CTGGAGAAGG CCCGTCCCGC CGTCGTGGTT CTTGACCCCG TGATGGTCGC CACCAGCGGG 
GACAGGCTCC TGCAGGAGGC GGCCGAGGCG GCACTGCGCG AACTCCTGCC CCTCGCCGAC 
CTCGTCACTC CCAACCTGGC GGAACTGGCG ATGCTCCTCA ACGAACCGCT CGCGGACGAC 
TGGGAGGCGG CACTCGCCCA GGGGAAGCGC CTCGCCGCCC GGACCGGCGC CACTGTGCTC 
GTCAAGGGCG GACACCTCGA CGGCGGGGAG TGCCCTGACG CGCTGGTCAA CACGGCAGGG 
CTGCTCGCCC AGGACGTTGT GGTTGTACCC GGCGAGCGGA TCGATACCAT GAACAGCCAC 
GGCACCGGCT GCTCCCTGTC CTCGGCAATG GCCACCGCGC AGGCGAGGCT GGGGGACTGG 
GAGGAATCCT TGCGGACAGT GAAGCCATGG TTGCAGGGGG CGCTCCGGGA AGCCGGCGCC 
TTGGACGTGG GAACAGGCAA CGGCCCGGTG CACCATTTCC ACCACCTGGC CCCCAAAGGA 
AGTGATGCGC CCCCCGAAGG CCGGTTCGCA GCGGTGCTCT GGCAAGATGC CGGGCCGGAC 
CTGGACGCCG TCTACGAGCT CGACTTCATC CGCGGCCTGG CCGACGGCTC CCTCACCGAG 
CAGCACTTCG CCTATTACCT TGCCCAGGAT GCCATCTACC TGAACGGCTA TTCCCGGGTA 
CTTTCGCGCG CCGCCGCCAT TGCCCCGACC GAGGTGGAAC AGCTGTTCTG GGCGCGGTCG 
GCACAGCAAT GCCTTGAAGT CGAGTCCGAA CTGCACCGGA CATGGCTCAG CACACGGAAC 
GTGGACACCG CACTCGGACC GGTTACGAAG TCCTACGTGG ACCACTTGCT GGCCTCATCC 
GTTTCAGGCA GCTACGGGGT ACTCGTCGCC GCTGTGCTCC CATGCTTCTG GCTGTATGCA 
GAGGTGGGTG CCACCCTGCA CGGGCAGTTC CTTGCTGCCG GGTCGGCCCC GGACCACCCG 
TACGCCGAAT GGCTCCGCAC CTACGCGGAC GAAGGGTTTG CCGCCGCCAC CCGGCAGGCG 
GTGCGCATTG CCGACGACGC TGCCCGTGCC GCGTCTGACG CGGAGCGGCA AGCCATGCGG 
GTGGCCTTCC GGCAGTCGTG CCGGTACGAG GTGGAATTCT TCGACGCGCC GAGGCTTCAC 
GCTGCACCGC AAAGCATTCC CGAGCCGGTA CGATAG

Protein sequence

MSPLASSFLP TPASEVARES SPGGTVLRST PRVLAIAGSD PSGGAGIQAD LKSIAANGGY 
GMAAITALTA QNTRGVRAVH VPPADFLTAQ LEAISDDISI DAVKIGMLGD SSVIAAVRSW 
LEKARPAVVV LDPVMVATSG DRLLQEAAEA ALRELLPLAD LVTPNLAELA MLLNEPLADD 
WEAALAQGKR LAARTGATVL VKGGHLDGGE CPDALVNTAG LLAQDVVVVP GERIDTMNSH 
GTGCSLSSAM ATAQARLGDW EESLRTVKPW LQGALREAGA LDVGTGNGPV HHFHHLAPKG 
SDAPPEGRFA AVLWQDAGPD LDAVYELDFI RGLADGSLTE QHFAYYLAQD AIYLNGYSRV 
LSRAAAIAPT EVEQLFWARS AQQCLEVESE LHRTWLSTRN VDTALGPVTK SYVDHLLASS 
VSGSYGVLVA AVLPCFWLYA EVGATLHGQF LAAGSAPDHP YAEWLRTYAD EGFAAATRQA 
VRIADDAARA ASDAERQAMR VAFRQSCRYE VEFFDAPRLH AAPQSIPEPV R