Gene Arth_3425 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3425
Symbol
ID	4444155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3855308
End bp	3856672
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	70%
IMG OID	639691249
Product	hydroxydechloroatrazine ethylaminohydrolase
Protein accession	YP_832900
Protein GI	116671967
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.507053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACCC ACCGCTCCGC ACACAGGCTC TGGATCCGGA ATCCACTCGC AGCCTTCACC 
GCCAACAATC TTGATGCCAC CGGCGGGATC GTGGTGGCCG GCGGCATCAT CACGGAAGTC 
CTGGCCGCCG GCCAGCAGCC TTCCGCGCCC TGCCAGGAAA CGTTCGAGGC CGGCAGCCAC 
GTCCTGCTGC CGGGCCTGAT CAACACCCAC CACCACTTCT ACCAAACACT CACGCGTGCC 
TGGGGTCCGG TGGCCAACGT CCCGCTGTTT CCGTGGCTGC AGAACCTGTA CCCGGTCTGG 
GCCCGGCTCA AGCCGCGGGA CCTGGAACTG GCTACCACCG TTGCACTCGC GGAACTGCTG 
CTCTCCGGCT GCACCACAGC CGCTGACCAC CACTACCTCT TCCCCCAGGG CATGGAAGAC 
GCCATCGACA TCGAGGTCCG GGCGGTGCGG GAGCTCGGCA TGCGGGCCAC GCTCACCCGC 
GGCTCCATGA CGCTCGGAGA GGACGACGGC GGCCTGCCGC CACAGTCCAC CGTCCAGCAG 
CCGGACGTGA TCCTGGCGGA CAGCGAGCGG CTCATCCGGG AGTATCACGA ACGCGGCGAC 
GGCGCCGTCA TCCAGGTTGC CCTGGCCCCG TGCTCGCCGT TCTCCGTGAC CAAGGAGATC 
ATGGCCGAGA GCGCCGCACT GGCCGAACGG CATGACGTCC GGCTGCACAC GCACCTGGCT 
GAAACGCTGG ACGAGGAAGA CTTCTGCCGG AAGATGTTCG GCCTGCGCAC GGTGGAATAC 
CTGGAGAGCG TGGGCTGGCT CGGCAACCGG ACCTGGCTGG GCCACGGCAT CCATTTCAGC 
GATGCAGAGA TCGCCGCGCT GGGAGCCGCG GGCACCGCCG TCGCGCACTG CCCCACGTCC 
AACATGCGGC TGGCCTCGGG CACTGCCCGG GTACTCGAAC TGGAGGATGC CGGAGTGCCG 
GTGGGGCTGG GAGTGGACGG GTCGGCGTCG AACGACGCCT CGAACATGAT CCTGGAGGCA 
CGGCAGGCCC TGTACCTGCA GCGGCTGCGC TACGGGGCGC AGGTCCCGGT GGAGCGGGCG 
CTGGGCTGGG CGACCCGGGG GTCGGCGGCG GTGCTGGGCC GCTCCGACCT GGGCCAGCTG 
GCACCCGGGA TGCAGGCGGA CCTGGCGTTG TTCCGGCTCG ACGAGCTGCG GTTCTCCGGC 
AGCCACGACC CCCTCGCCGC GCTCCTGCTG TGCGGAGCGG ACCGGGCCGA CCGGGTGATG 
GTGGGCGGGC AGTGGCGCGT GGTGGACGGG CAGATCCCGG GCCTTGATGT TGCCGGGCTG 
ATCGCGGAAC ACTCGGCCGC TGCACGGAAG CTGGTGAACG GGTAG

Protein sequence

MATHRSAHRL WIRNPLAAFT ANNLDATGGI VVAGGIITEV LAAGQQPSAP CQETFEAGSH 
VLLPGLINTH HHFYQTLTRA WGPVANVPLF PWLQNLYPVW ARLKPRDLEL ATTVALAELL 
LSGCTTAADH HYLFPQGMED AIDIEVRAVR ELGMRATLTR GSMTLGEDDG GLPPQSTVQQ 
PDVILADSER LIREYHERGD GAVIQVALAP CSPFSVTKEI MAESAALAER HDVRLHTHLA 
ETLDEEDFCR KMFGLRTVEY LESVGWLGNR TWLGHGIHFS DAEIAALGAA GTAVAHCPTS 
NMRLASGTAR VLELEDAGVP VGLGVDGSAS NDASNMILEA RQALYLQRLR YGAQVPVERA 
LGWATRGSAA VLGRSDLGQL APGMQADLAL FRLDELRFSG SHDPLAALLL CGADRADRVM 
VGGQWRVVDG QIPGLDVAGL IAEHSAAARK LVNG