Gene Arth_3642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3642
Symbol
ID	4443643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4093265
End bp	4094938
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	64%
IMG OID	639691466
Product	5-oxoprolinase (ATP-hydrolyzing)
Protein accession	YP_833117
Protein GI	116672184
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0146] N-methylhydantoinase B/acetone carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATCG CTGCAGTCAA AACCCTGGAT CCCGTAACCG TGGAGATCAT CCGCAACGCG 
CTCACCAGCG CCGCGGACGA TATGAATGCA ACCCTGATCC GCTCCGCCTA CTCGCCCATC 
CTCTATGAGG GCGGTGACTG CGTGGTGGCG CTGCTGGACA AGGAACACCG TGTACTCGGA 
CAATCCGCGG GGCTCCCGCT GTTCCTCGGC AACCTGGAAA CGTGCTCCAT CGCTGTGGAG 
GAGCTGTACG GCCGCGAAGT CTGGCAGGAA GGGGACGTGT GGATCCTCAA CGACTCCTAC 
CTTGGCGGAA CGCACCTGAA CGATGTCACC ATCTTCGCGC CGATTTTTGA TGACGGCTCG 
GTGGTTGGCT TCGCCGCCAC CCGCGCGCAC TGGATGGACA TGGGGTCCAA GGATGTGGGC 
GGCTCGATGG ATGCCACGGA CATCTTCCAG GAAGGCTTCC GTATGGGGCC GGTCAAGCTC 
ATGGAAGCCG GCATTGAAAC CTCGGTGGTG GACCTGATCC GCACCAACGT GCGTTTCCCC 
TACCAGACCA TCGGCGACAT GCACGCGATG ATCGCCGCAC TCCGGATGGG AACCACCCGG 
ATGAAGGAGC TGGTGGGCCG GTACGGCATG GAGCAGCTCG ATGCTGCCCG CGATGAAATC 
TTCCGCCAGA CAGAGGAGAT CGAGCGCGAA ACCGTCCGAA ACATCCCGGA CGGCGTCTAT 
GAAGCCGAAG GCGTGCTGGA CAACGACGGC ATCAACCTGG ACACGCCCAT CCCCATCCGG 
CTGAAGATCA CCGTTGCCGG CGACACTGTT GACTTCGACG TCACCGGCTC CGCCGACCAG 
ACCATGGGCC CGGTCAACTG CGGCGCAGCC CAAGCCGTTT CGGCCCTGCG CGTGGGGTAC 
AAGCTCCTCG TCAGCCCGGA CTCCAACTCC AACGGCGGAT CCTTCCGCCC ACTGACCACG 
CAGGTGCGTT CCGGGTCGGT GCTCGGCGCC GTGGCACCTG CACCGTGCCA GTGGTACTTC 
TCCCATCTGG GGCTGCTGAT CGACCTGGTC TCCAAGGCAA TGGCCCCCGC AATGCCTGAA 
CGCGTAGCCA GCGCCAGCCA CGGCGACTCA ATGATCATCA CCGCCGCTGG CTTCGATCCC 
CGCTTCGGCC GGAACTTCGT CAGCATGGAA GCCACTCTGG GCGGCTGGGG CGCCTGGCAG 
GGCACGGATG GCGAATCCGC CATGATCAAC AACGTCAACG GCTCGCTCAA GGACCTGCCC 
ATCGAAATGA TGGAAACCCG GTACCCGCTG CGGATCAACG AGTACTCCAT CCGGCCGAAC 
TCCGGTGGCC CAGGGCAGTG GCGCGGCGGC AACGGAGTTA TCCGTGAATA CGAGTTCCTG 
GCCGACTGCG TGGTAGGCCT CTGGTTCGAA AGGTCCAAGA CGCCGGCCTG GGGCCTCTTC 
GGCGGTTCCG ACGCCCAGGG CCCGGAAGTG GTGATCAACC CCGGCCGGCA CGACGAGGTC 
CGGACGCTGA AGGCCAACGC ACGGAAGGTC AAGGCCGGCG ACGTCGTCCG CCTGGCAGTC 
GGGGGCGGTG GCGGTTTCGG AGATGTCTCC AAACGTACCC GTGAAGACAT CAAGTACGAC 
ATCGTCAACG GTTTCATCAC CGAGGACTTC GCCAAGACCC ACTACGGCTA CTAA

Protein sequence

MTIAAVKTLD PVTVEIIRNA LTSAADDMNA TLIRSAYSPI LYEGGDCVVA LLDKEHRVLG 
QSAGLPLFLG NLETCSIAVE ELYGREVWQE GDVWILNDSY LGGTHLNDVT IFAPIFDDGS 
VVGFAATRAH WMDMGSKDVG GSMDATDIFQ EGFRMGPVKL MEAGIETSVV DLIRTNVRFP 
YQTIGDMHAM IAALRMGTTR MKELVGRYGM EQLDAARDEI FRQTEEIERE TVRNIPDGVY 
EAEGVLDNDG INLDTPIPIR LKITVAGDTV DFDVTGSADQ TMGPVNCGAA QAVSALRVGY 
KLLVSPDSNS NGGSFRPLTT QVRSGSVLGA VAPAPCQWYF SHLGLLIDLV SKAMAPAMPE 
RVASASHGDS MIITAAGFDP RFGRNFVSME ATLGGWGAWQ GTDGESAMIN NVNGSLKDLP 
IEMMETRYPL RINEYSIRPN SGGPGQWRGG NGVIREYEFL ADCVVGLWFE RSKTPAWGLF 
GGSDAQGPEV VINPGRHDEV RTLKANARKV KAGDVVRLAV GGGGGFGDVS KRTREDIKYD 
IVNGFITEDF AKTHYGY