Gene Achl_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3520
Symbol
ID	7295001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	3897838
End bp	3899124
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	71%
IMG OID	643591926
Product	allantoate amidohydrolase
Protein accession	YP_002489565
Protein GI	220914256
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0261645
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCTTC CCCAGACAGC ACCCGCACCG CCTGCCGTAC CCGCAGAAAC CGCCGGCGCA 
CCCACCGTTG CCGGCCTCCT GAAGGAAATC TCCGACGTCG GGCGTGACAG GACCCGCGGC 
GGCTACTCCC GCCCGGTGTT CTCCACCGCC GAAACGGACC TGCGGATCTG GTTCATCGAG 
CGGGCCACCC GGCGTGGGCT GGACGTCCAC ACCGACGCCA ACGGCATCAT CTGGGCCTGG 
TGGGACACGG CCGCGGGTGT GCGGAAGGAC GCGGTGGCCA CCGGCAGCCA CCTCGATTCC 
GTCCCCGGCG GCGGCGAGTA TGACGGCCCC CTGGGGGTCG CCTCGGCACT GGTGGCCGTC 
GACCTCCTCA AAGCACGCAA CTTCCGCCCG CGCCGCCCCC TGGCGATCGC AGTGTTTCCC 
GAGGAGGAAG GCTCGCGGTT CGGCATCGCC TGCCTTGGCT CGCGGCTCCT CACCGGCGAA 
CTCGATCCCA ACAAGGCCCG CAACCTCCGC GACCCGGACG GCAACACCTA CGCCGACGTC 
GCAGCGGCCA ACGGACAGGA CCCGCGGTTC ATCGGCGCCG ACTACAAGGC GCTGCAGCAG 
CTGGGCCTGT TCGTTGAACT GCACGTGGAA CAGGGGAGGG GCCTGATCGA CCTGGACCAG 
CCGGTGGCGG TTGGTTCGTC CATCCTGGGC CACGGCCGCT GGAAACTGGC CATCTCCGGC 
GAGGGAAACC ACGCAGGCAC CACACTGATG CAGGACCGCA GGGACCCCAT GATCGCGGCC 
GCCAAAGTGG TGGTGGGCAT CCGTGAGACC GCCCGCAAGT ACCGGGACGC CCGTGCCACG 
GTGGGCCGGC TGCAACCCGT CCCCGGCGGC ACCAACGTCA TCGCGTCCCG CGTGGACCTG 
TGGATCGACG TCCGCCACCC GGAGGACTCC GTCACCGCCG CGCTGGTGGA GGCCATCGGG 
CTGAACGCCC AGGTCCTCGC CGCCGAGGAA GGCTGTTCCG CCGCCCTCAC CAGGGAGTCG 
CTGAGCCCCA CAGTGCAGTT CGACGACGGA CTCCGGGACC GGCTGCAGCA GCTCCTTCCT 
GCCGCTCCCG TGCTGGCCAC CGGTGCAGGG CACGACGCCG GGGTGCTGGC GGCGCACCTG 
CCCACGGCCA TGCTGTTCGT CCGCAACCCC ACGGGCATCT CGCATTCGCC CGACGAACTG 
GTGGAGGACC GGGACGCCGA AGCCGGCGCC CTTGCCCTGG CGGACTCCCT GGCCGGGCTC 
CTGGGCGGGG CCCGTACCGT TGGCTAG

Protein sequence

MSLPQTAPAP PAVPAETAGA PTVAGLLKEI SDVGRDRTRG GYSRPVFSTA ETDLRIWFIE 
RATRRGLDVH TDANGIIWAW WDTAAGVRKD AVATGSHLDS VPGGGEYDGP LGVASALVAV 
DLLKARNFRP RRPLAIAVFP EEEGSRFGIA CLGSRLLTGE LDPNKARNLR DPDGNTYADV 
AAANGQDPRF IGADYKALQQ LGLFVELHVE QGRGLIDLDQ PVAVGSSILG HGRWKLAISG 
EGNHAGTTLM QDRRDPMIAA AKVVVGIRET ARKYRDARAT VGRLQPVPGG TNVIASRVDL 
WIDVRHPEDS VTAALVEAIG LNAQVLAAEE GCSAALTRES LSPTVQFDDG LRDRLQQLLP 
AAPVLATGAG HDAGVLAAHL PTAMLFVRNP TGISHSPDEL VEDRDAEAGA LALADSLAGL 
LGGARTVG