Gene Arth_3600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3600
Symbol
ID	4443911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4041678
End bp	4042910
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	67%
IMG OID	639691424
Product	N-isopropylammelide isopropylaminohydrolase
Protein accession	YP_833075
Protein GI	116672142
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCATCA CTAACGTCCG CCCCTGGGGC GGGGACAACG TAGACCTCGA GGTTCACGAG 
GGGCGTATTG CAGCCGTTCA TCCCGCGGGG ACCGGCGACG TGTCAGCTGA CGCCGCCGGC 
GGCACGATCG ACGGACGCGG CCGCATCGCC TTCCCCGCTT TCACGGACGT GCACGTCCAC 
CTCGACTCGA CCCGGATAGG ACTGCCGTTT CGGGAGCACA CCGCCTCTCC CGGGGTGTGG 
AACATGATGT GCAACGACCG GGAAAACTGG CGTGACACGC CCATCCCGTA CGCGGATGTG 
GTGGCAGGAA CGCTGGAACG GATGATTGCG CGGGGCACCA CACGCGTCCG TTCCTATGCG 
CAGATCGATG TGGACTGCAA GCTTGAGCGC TTCGAAGCAG TCCTGGCGGC GAAGGAGCGC 
TTCGCCCACG CGGCCGAGGT AGAAGTCATG GCTTTCCCCC AGGCGGGCCT CCTCCTCGAG 
GACGGCACTG TGCCGCTCCT TGAGGAGGCC CTCCGTGCGG GGGCGACCAC CATCGGCGGC 
ATTGATCCCT GCCAGCTGGA CCGCGACCCG GCCCGCCATC TGGACATCGT CTTCGAGCTG 
GCCGAGAAGT ACGGGGTGGA CGTGGATATT CACCTGCACG AGCCCGGCCA TCTGGGGGTC 
TTCAGTGCGG AACTCATCTT CGAACGCACC CGCGCACTGG GCATGCAGGG ACGCGTCTCG 
CTTTCCCACG CCTACGATCT GGCCAACGTC CACCCCGATG TGACCGCCCG GATCGTGGAG 
CAGATGGCCG AGCTGGACGT CGCCTGGGCG ACCGTGGCCC CGGCAAGTGG AGGCGCCCAG 
TTCGACCTGG CCCGGATGAC GGAGGCCGGG ATCCGCGTTG GTCTGGGCGA GGATGGTCAA 
CGGGATTACT GGAGTCCGTA TGGCAATTGC GACATGCTCG ACCGCACCTG GCAGCTGGCC 
TTCACGCACC GGCTGCGCAA GGACCGTCTC ATCGAGCACT GCGCGGCGAT CGCCACGGTC 
GGAGGCGCGT CCATCATGGA CCGCACCGTC CCGCGGCTCA CCAGCCCCGA CGACCGGCCG 
GGCCTGACCC CAGGCGACCG GGCCGACGTC GTCCTGGTAG ACGGCGAAAC CGTCACCAGC 
ACCGTCATGG ACCGCGGCAC CGACCGCACC GTCATACACG ACGGCAGGCT CGTCGCCGAC 
GGGCTGGCTG TTCTTCCACG CGCAGCCGGG TAA

Protein sequence

MLITNVRPWG GDNVDLEVHE GRIAAVHPAG TGDVSADAAG GTIDGRGRIA FPAFTDVHVH 
LDSTRIGLPF REHTASPGVW NMMCNDRENW RDTPIPYADV VAGTLERMIA RGTTRVRSYA 
QIDVDCKLER FEAVLAAKER FAHAAEVEVM AFPQAGLLLE DGTVPLLEEA LRAGATTIGG 
IDPCQLDRDP ARHLDIVFEL AEKYGVDVDI HLHEPGHLGV FSAELIFERT RALGMQGRVS 
LSHAYDLANV HPDVTARIVE QMAELDVAWA TVAPASGGAQ FDLARMTEAG IRVGLGEDGQ 
RDYWSPYGNC DMLDRTWQLA FTHRLRKDRL IEHCAAIATV GGASIMDRTV PRLTSPDDRP 
GLTPGDRADV VLVDGETVTS TVMDRGTDRT VIHDGRLVAD GLAVLPRAAG