Gene Arth_1650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1650
Symbol
ID	4445842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1843289
End bp	1844311
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	67%
IMG OID	639689465
Product	inosine/uridine-preferring nucleoside hydrolase
Protein accession	YP_831144
Protein GI	116670211
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1957] Inosine-uridine nucleoside N-ribohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.358595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTCGG TCCTGATGGA CGTGGACACC GGGATCGACG ATGCCCTGGC CCTGGTCTAC 
CTCCTGTCCC GCCCCGACGT CCGGCTGCAG GCCATCACCT GCACCGCCGG AAACGTGGGC 
GCACGCCAGG TGGCACTGAA CAACCTTGCC CTGCTCGAGT TGTGCGGCAC ATCAGGAGTC 
GAAGTGGCGA TCGGGGCCGA AGTGCCGCTC GAGATCCCGC TGGTCACCAC GGAGGAAACC 
CACGGACCGC AGGGAATCGG CTACGCCGAG CTGCCGGTGC CCGCGCAACA AATCTCGGAG 
CGGCACGCCG TGGACGTCTG GGTGGACGAG GTGCGCAAGC ACCCGGGCGA GATCACGGGC 
CTTATCACCG GCCCGCTGAC CAACTTCGCC CTCGCCCTCC GCCGGGAACC GGAACTGCCG 
CAGTTGCTCA AGGGGCTGGT GATCATGGGC GGTTGCTTCT ACTACCAGGG CAACACCACC 
CCGACGGCAG AGTGGAACGT CTCGGTCGAT CCGCATGCCG CGAAGGAAGT CTTTGCCGCC 
TACCGGGGCC TCCCGGAGGA CAAGCTGCCG GTGGTGTGTG CCCTGGAGAC CACCGAACTG 
GTCGAGATGC GGCCCGAACA CCTGCAGCGA CTGGCCGAAG CCGCCGGCAC TGGTCCGGAA 
CTCGTCCTTC CGGACCAGCC GGAGGGGCTC CGCAGCAGCT CCGGCAACCC CCTGGTGGCG 
TGCCTGTCCG ATGCCATCCG CTTCTACATG GAGTTCCACC GGCTCTACGA CCAGGGCTTC 
GTGGCCCACG TGCACGACGC CTTCGCTGCC TGTGTGGCCG TGGGCCGGAC GGAATACACC 
GCCCGGCTGG CAACGGTTGA CGTCGAGACC GGATCCGCGC TGCTGATGGG CACCACCGTC 
GCCGATTACC GCGGACTGTG GGGGCTGCCG CCGAACGCCC GGATTGTGAC GTCGAACAAT 
CCGAAGCAGT GCTTTGATGA GCTCATCAAT TCAGTGGGCG CACTGGCCAG GCGGCTGGCC 
TAA

Protein sequence

MHSVLMDVDT GIDDALALVY LLSRPDVRLQ AITCTAGNVG ARQVALNNLA LLELCGTSGV 
EVAIGAEVPL EIPLVTTEET HGPQGIGYAE LPVPAQQISE RHAVDVWVDE VRKHPGEITG 
LITGPLTNFA LALRREPELP QLLKGLVIMG GCFYYQGNTT PTAEWNVSVD PHAAKEVFAA 
YRGLPEDKLP VVCALETTEL VEMRPEHLQR LAEAAGTGPE LVLPDQPEGL RSSSGNPLVA 
CLSDAIRFYM EFHRLYDQGF VAHVHDAFAA CVAVGRTEYT ARLATVDVET GSALLMGTTV 
ADYRGLWGLP PNARIVTSNN PKQCFDELIN SVGALARRLA