Gene Arth_2512 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2512
Symbol
ID	4444918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2813736
End bp	2814761
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	639690327
Product	thiamine-monophosphate kinase
Protein accession	YP_831991
Protein GI	116671058
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.112077
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCTGAAT CTCACCTCAC CGTTGACGGA CTTTCCGAAT CCGAGCTCCT CGCCAGGATC 
TTTCCGCGCC TGAACAAAGG TCCAGCCGAG GGCACGGCGC TCCTGCTGGG ACCCGGGGAT 
GACGCCGCCA TTGTGGCAGC CCCGGACGGC CGGACCGTGG TCAGCATTGA CACTCAGGTC 
CAGGACCAGG ATTTCCGGCT GGTGTGGCGA AACGGGTACC GGACCACCGG CTTCGACGTC 
GGCTGGAAGG CCGCGGCGCA GAACCTGAGC GACATCAACG CCATGGGTGC GCGGTCCGTG 
TCCATGGTGG TGAGCCTGAC CCTGCCTCCG GAGACGCCGG TTTCCTGGGT TGAGGATTTC 
GCGGACGGGC TGTCCCACGC CATCAGCGGC CTTGGCGCCG CTGGATGTTC CGTGGCCGGC 
GGGGACCTGG GCCGGGGCCG CGAACTGGCC GTGACCGTGG CCATCCTGGG CACCCTGGAC 
GGGCGGGAGC CGGTATTGCG CTCCGGGGCC CGTCCCGGGG ACACCGTCGC GCTGGCCGGA 
ACGCTGGGGC TCGCGGCGGC GGGCCTTGCC CTGCTGGAGT CGGCATTGGA TGTTGAACGG 
TTAACGCCGG AGCAGCGGAC CATTATGGAC AGGCAATGCC GGCCGCTGCC GCCGCTGGAT 
GCCGGGCCGT CCGCACTCGC GGCAGGCGCC TCGGCCATGA TGGATGTTTC CGACGGACTG 
ATCCGCGACG GCAACCGCCT GGCCGCCGCC AGCGGCGTGG TCCTGGACCT TGATCCCGAC 
GCCCTGAAGC AGCTCGCAGA GCCTTTGGCC GCTGTCGCGG ACGCGGTGGA CGGCGACCCC 
ATGGTCTGGG TGCTCGGCGG AGGGGAAGAT CATGGACTTC TTGCCACATT CCCGGCGGAC 
GTTCAGCTGC CTCCGGGTTT CGCTGCGATA GGCTCAGTAG AAGCCCTTGC ACCAATGGAA 
AGCACTGGCG TGACGATAGC GGGCCGGCCC GCGGACACTG TGGGATGGGA TCACTTTGCA 
GACTAA

Protein sequence

MPESHLTVDG LSESELLARI FPRLNKGPAE GTALLLGPGD DAAIVAAPDG RTVVSIDTQV 
QDQDFRLVWR NGYRTTGFDV GWKAAAQNLS DINAMGARSV SMVVSLTLPP ETPVSWVEDF 
ADGLSHAISG LGAAGCSVAG GDLGRGRELA VTVAILGTLD GREPVLRSGA RPGDTVALAG 
TLGLAAAGLA LLESALDVER LTPEQRTIMD RQCRPLPPLD AGPSALAAGA SAMMDVSDGL 
IRDGNRLAAA SGVVLDLDPD ALKQLAEPLA AVADAVDGDP MVWVLGGGED HGLLATFPAD 
VQLPPGFAAI GSVEALAPME STGVTIAGRP ADTVGWDHFA D