Gene Acid345_3921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3921
Symbol
ID	4071304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4635810
End bp	4637414
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	62%
IMG OID	637985947
Product	5-oxoprolinase (ATP-hydrolyzing)
Protein accession	YP_592995
Protein GI	94970947
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0146] N-methylhydantoinase B/acetone carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.710611
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.101565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGCA AGTTTGATCC TATCGAGCTT GAGATTTTCA AAAGCATCTT CCACTCGATT 
GCCGAGGAGA TGGGTGCGGC GCTACGACGC ACCGCGTTTT CTCCCAACAT CAAAGAACGT 
CGCGATTATT CTTGCGCGGT CTTCGACGCT GCAGGCCACG CGCTCGCGAT GGGCGATCAC 
ATGCCGGTGC ACCTGGGCTC GATGCCGATG AGCGTGGCAG CCGCGCTGCA AGACCTGGTG 
CTCGAACCCG GCGATGTCGC GATGGTGAAC GATCCGTTCC GAGGCGGAAC CCATCTGCCG 
GACATTACGT TTGTAGCGCC CGTATTCATT GGTAAGAACA AGAAGCCGGA TTTCTTTGTG 
GCATCGCGCG CGCACCACGC GGATGTCGGC GGAACGTTCG CGGGATCGAT GGGTCTGTGC 
AGCGAGATTT ACCAGGAAGG CTTCCGGATT CCGCCGGTGA AGCTGGTGCG TCGCGGGAAG 
ATGGATCGCG ATCTGCTGGC CCTGTTGCTG GCGAACGTGC GTACGCCGCG CGAGCGCGAA 
GGCGATTTGA GCGCGCAGAT TGCCGCGTGC CATACCGGCG AAACGCGGCT GCGTGAAGTC 
TGTGCGCGCT ACGGGCTAGC GCGGGTGCAG CAGGCGGCTG ACGCACTGCT GGACTATTCC 
GAGGCGATGA TGCAATCGCT CCTGGCGCAA ATTCCTGTGG GAAGCTACGA GGCAGAAGAT 
TTCCTCGATG ACGACGGCGC TCCGGTTGCG GGAACGAGTG AGGTGCACGC CTCGAAGCCA 
GTTCGAATCG CAGTGAAACT CACATTCGCG CGGGAGAAGA AGCGCAATGT GGTGACCGTA 
GATTTCACGG GAACCGACCC GCAAGTGAGT GGGAGTACGA ACGCGGTGGA GGCGATCACT 
TACTCGGCAT GTTTCTACGT ATTCCGCTGT TTGCTGGCGG AAGACGTGCC GGCAACCAGC 
GGATTAATGC GGCCAGTGCG TTTGATCGCG CCGAAAGGGA CGGTGGTGAA TGCCCGGCCA 
CCAGCGGCAG TCGCGGGCGG CAACGTGGAG ACGTCGCAAC GAATTGTGGA TGTGCTGCTG 
CGCGCGCTGG CGAAGGTAAT GCCGGAGCGG ATTCCAGCGG CTTCCTCCGG AACCATGAAC 
AACCTGACCA TCGGCGGAAT CGATCCCCGC ACCGGCGAGC CCTTCGCCTA TTACGAGACG 
ATCGCCGGCG GGTCCGGAGC GAATACCGAC GGCGACGGCG CAAGCGGTCT GCATACGCAC 
ATGACGAACT CGCTCAACAC GCCCGCAGAG GCGCTGGAGT ATGCCTATCC CTTCCGCGTA 
ACGCGCTATG GGATTCGGCG CGGAAGCGGT GGAGCGGGGA AGCATTGTGG CGGCGATGGC 
ATCGTGCGAG AAATCGAGGT GCTGACGGAT GCGCAGGTCA CGTTGCTCTC GGAGCGACGA 
ACGATTCCGC CGTATGGAGC AAAAGGCGGA TCACCGGGAT CGCTGGGCAA AGCGGCGATC 
GTGGGCTCGG AGGCGCGAAC AATCCCAGGC AAAGCGACTG GGAAACTAAA GAAGGGCGAA 
CGGATTCGCG TGGAAACCCC GGGCGGTGGT GGCTGGGGCC GCTGA

Protein sequence

MARKFDPIEL EIFKSIFHSI AEEMGAALRR TAFSPNIKER RDYSCAVFDA AGHALAMGDH 
MPVHLGSMPM SVAAALQDLV LEPGDVAMVN DPFRGGTHLP DITFVAPVFI GKNKKPDFFV 
ASRAHHADVG GTFAGSMGLC SEIYQEGFRI PPVKLVRRGK MDRDLLALLL ANVRTPRERE 
GDLSAQIAAC HTGETRLREV CARYGLARVQ QAADALLDYS EAMMQSLLAQ IPVGSYEAED 
FLDDDGAPVA GTSEVHASKP VRIAVKLTFA REKKRNVVTV DFTGTDPQVS GSTNAVEAIT 
YSACFYVFRC LLAEDVPATS GLMRPVRLIA PKGTVVNARP PAAVAGGNVE TSQRIVDVLL 
RALAKVMPER IPAASSGTMN NLTIGGIDPR TGEPFAYYET IAGGSGANTD GDGASGLHTH 
MTNSLNTPAE ALEYAYPFRV TRYGIRRGSG GAGKHCGGDG IVREIEVLTD AQVTLLSERR 
TIPPYGAKGG SPGSLGKAAI VGSEARTIPG KATGKLKKGE RIRVETPGGG GWGR