Gene Acid345_2556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2556
Symbol
ID	4072200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3019411
End bp	3020862
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	58%
IMG OID	637984573
Product	amidohydrolase
Protein accession	YP_591631
Protein GI	94969583
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGT TGCTTTCAAT ATCCGCACTC GTTTGCTGCA GCGCGATGCT CTCCGCGCAG 
GGGAAACTCA GCGAAGATGT GCAGCGTTAT GTGAAGGTGA ATTCCGCGCG CGTGGTGCTG 
GAACATGTTC GCGTGATCGA CGGTACCGGC AAAGCGCCTG TCGAGGACCA GAACGTCGTG 
ATCGAGAACG GCAAGATCAC CGCGATTCAA CTTGGTGCAG ACGTGAAGGC CGGCGCAAAC 
GAAACCGTGC TCGATCTTCG CGGTTCCACG GTTTTTCCGG GGATCGTCGG GATGCACGAC 
CATATGTACT ACATCGCGCG ACCGAACTTG GCTGCCGACG GCAGCTCCGA GCCGCCGTTG 
ATCGTGCCGC AGATGACGTT CACTTCGCCC AGGCTTTATC TGGCGGCGGG GGTGACCACG 
CTGCGTACGA CCGGCAGCGT TGAGCCGTAC ACCGATCTCA ACCTCCGCGA CCTGATCAAC 
AAAGGCGAAC TGGTTGGTCC GCACATGGAC GTTACCGGCC CCTACCTCGA AGGGTCGGGC 
AGTCCGTTCA TGCAGATGCA TCCGCTGAAG GACGCGGAGG ATGCGCGGAA GACGGTTGCG 
TTTTGGGCGG ACCAGGGCGC GACGTCATTC AAGGCTTATA TGAACATCAC TCGCGATGAG 
CTGAAAGCGG CTATTGATGA GGCGCATCGC CGCGGGTTGA AGATTACCGG TCATCTTTGC 
TCAGTCACCT ATCCGGAAGC CGCCGACTTG GGCATAGACG ACCTTGAACA TGGCTTCTGG 
GTGAACACTC AACTGGACCC TGACAAAGCG CCGGATGTGT GCTCCAAGGC GGCAGGCGGA 
CCGACGCTCG AGAAGATGGA TCCAAACGGT GCTGAGGCCA AGGCACTCAT TGAGAAGCTC 
GTCAGCAAGC ACGTGGCAAT TACCTCTACG CTGCCGGTGT TTGAAAATAT CGTGCCGGGG 
CGTCCGGCGC TTTCGAAGCG CAACATGGAC ATCCTCTCGC CGCCCTCCAA AGAAGCCTAT 
CTGTTTGCGC GCAACCGTCG CTACGCCACG TCCAAAGGGA ATGAAGCGCA ACTGTTTCGT 
CGCGACATGG ATTTAGAAGT GGCTTTTGTC CGCGCTGGCG GGTTGCTGCT CGCCGGGCCC 
GATCCCACCG GTAACGGGGG AACGTACCCA GGCTTCAGCG ATCAGCGTGA AATCGAGTTA 
CTCGTGGAAG CTGGCTTTGC GCCAGTAGAA GCGATCAAAA TCGCGACCTT TAACGGTGCT 
CTCTATATGG GCAAGCAGGA GAGCATCGGT TCACTTGGCG CAGGCAAGAA CGCCGATCTC 
GTGGTGGTGA AGGGAAATCC GGCACAGAAG ATTGATGACA TCGAAAACGT TGAGATCGTC 
TTCAAGGATG GGGTGGGTTA CGACTCTGCG AAGCTGATCG AATCAGTGCG CGGACGTTAC 
GGACAATACT GA

Protein sequence

MKLLLSISAL VCCSAMLSAQ GKLSEDVQRY VKVNSARVVL EHVRVIDGTG KAPVEDQNVV 
IENGKITAIQ LGADVKAGAN ETVLDLRGST VFPGIVGMHD HMYYIARPNL AADGSSEPPL 
IVPQMTFTSP RLYLAAGVTT LRTTGSVEPY TDLNLRDLIN KGELVGPHMD VTGPYLEGSG 
SPFMQMHPLK DAEDARKTVA FWADQGATSF KAYMNITRDE LKAAIDEAHR RGLKITGHLC 
SVTYPEAADL GIDDLEHGFW VNTQLDPDKA PDVCSKAAGG PTLEKMDPNG AEAKALIEKL 
VSKHVAITST LPVFENIVPG RPALSKRNMD ILSPPSKEAY LFARNRRYAT SKGNEAQLFR 
RDMDLEVAFV RAGGLLLAGP DPTGNGGTYP GFSDQREIEL LVEAGFAPVE AIKIATFNGA 
LYMGKQESIG SLGAGKNADL VVVKGNPAQK IDDIENVEIV FKDGVGYDSA KLIESVRGRY 
GQY