Gene Arth_3650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3650
Symbol
ID	4443651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4103096
End bp	4104382
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	65%
IMG OID	639691474
Product	amidohydrolase
Protein accession	YP_833125
Protein GI	116672192
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTCCCCA ATCTCCCGGG AAACCTGACC ATCCGGAACG CCAGGATCTT CGACGGCGAA 
TCCCCGGCTC TCGTTGAGGG CTCCATCACT GTCCGCGACG GCCGGATCAC AGCCGTGCGC 
GGCAGCGCAG AAGACAGTGG CGCCTCGCCC GACTCCGAGA CAGCACTCGA CGCGGGCGGC 
CGGGTGGTGA TTCCCGGCCT CATCGACGCC CACTTCCACG CCTACGCGCT TAGCCTGACC 
TCGGCGCTGA ACGAAACAGG GCCTTTGAGC TACTCCGCGC TGGCCGGTGC CCGCAGACTT 
GAGGCCGCAC TCCGCCGGGG CTTCACCTCG GTGAGGGACG TGGCTGGGGG CGATGTGGGC 
CTTTCGGCTG CAATCGAGGA AGGACTGTGC CCCGGACCCC GCTACTTCTA TACCGGTCCC 
GCGCTGAGCC AAACCGGCGG CCACGGTGAT ATTCGCGCCG CGAACGATGG AAGCTGCTTT 
CATGGCGGTC ATATGTGCGA GGTGGTGGAT GGCGTTGAGG ACTTGCTGCG GGCGGTGCGC 
CACAGGTTCC GGACCGGTGC CACCGCCATC AAGCTCATGA CCTCCGGGGG AGTGATCTCC 
CCCGTCGATC CGATTCGTGT CCCCCAGTAC AGCGCCGCGG AGATCCGGGC GGTCACTGAG 
GAGGCATCCC GGCGGGGCAG TTACGCCACC GCGCACGCTT ACTCACCAGA AGCCATCAGC 
CATTCGGTGC TCAACGGGGT TCGCTGCATC GAACATGGCA ACCTCCTGGA TGCTGAAACC 
GCCCGGCTGA TGGCGGAGTA CGACGTCTAT CTCGTGCCCA CGTTGGTGAC GTACGATGCG 
ATGGGCCGCC GCGGAGCGGA AATCGGGCTT ACCGAAATGG GCGCCGCCAA GAATCACGAA 
GTATTGGCCG CGGGAAAGAA CGCCGTCACA CTGGCACGGG AGGCCGGGGT CCGGATTGGC 
TTCGGCACCG ACCTTATGGG TGAACTTGAG GATGAACAGC TGGCCGGGCT GCGCCTTCAG 
GTCGAAGTGC TGGGCGTCTA CGACGCACTC CGCTCGGCGA CATCGACGAA CGCCGCACTC 
CTCGGGCGGG AAGACCTAGG ACACATCGCG GAGGGGGCCT GCGCGGACTT AGTGATACTG 
GACGGCGATC CCTTCGAGGA GCCCTCAGTG CTTTGGGACG GGAGCCGGAA ACGCATAGTC 
ATCAAGGCCG GCCACATTGT CTCCTCAGAC GGCCTTCGGG CCGGTAAAGC GGCGATGGAC 
GAGGCGATCA GCGGCGCTCA CAGCTGA

Protein sequence

MVPNLPGNLT IRNARIFDGE SPALVEGSIT VRDGRITAVR GSAEDSGASP DSETALDAGG 
RVVIPGLIDA HFHAYALSLT SALNETGPLS YSALAGARRL EAALRRGFTS VRDVAGGDVG 
LSAAIEEGLC PGPRYFYTGP ALSQTGGHGD IRAANDGSCF HGGHMCEVVD GVEDLLRAVR 
HRFRTGATAI KLMTSGGVIS PVDPIRVPQY SAAEIRAVTE EASRRGSYAT AHAYSPEAIS 
HSVLNGVRCI EHGNLLDAET ARLMAEYDVY LVPTLVTYDA MGRRGAEIGL TEMGAAKNHE 
VLAAGKNAVT LAREAGVRIG FGTDLMGELE DEQLAGLRLQ VEVLGVYDAL RSATSTNAAL 
LGREDLGHIA EGACADLVIL DGDPFEEPSV LWDGSRKRIV IKAGHIVSSD GLRAGKAAMD 
EAISGAHS