Gene Acid345_1841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1841
Symbol
ID	4072902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2218847
End bp	2219827
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	56%
IMG OID	637983850
Product	amidohydrolase 2
Protein accession	YP_590916
Protein GI	94968868
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.921197
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGGAC TGCGCCGCAC ATCAGTTCTC TGCATATTTC TTGCTCTCCT TCCCTTCGCT 
ACTGCGCAAT CGTCTAACGC CCGAGCTGTT CAATCGTGGC GGGCCGATCA CCACATGCAT 
TTATCGTCAG CCGATCTGTG CGCGCGCCTT GGTGATTGTC CTGATTGCGA GTGTCTCAAA 
TCCGATCAGC CCCCAGCGGT GCTTGCCGCC GACGCGATAA AAGCTCTCGA TGACGCACAT 
GTCTCGAAGG GCGTGATCTT GTCGGGCGCC TATTTGTATG CGAGGCCGTC GGTCCATCTT 
TCCGCAGGCG AGACAGCCAA GAAGGTTCGT TTGGAAAATG AGTTCACGGC CGCCGAAGTG 
GCAAAGTATC CCAAGCGACT GGTTGGGTTT TTCTCCGTGA ATCCGTTGCA GGATTCAGCC 
GTCGAGGAAG TCCGCTATTG GGGTGCGAAG TCGCAGTTCG CCGGACTTAA GCTGCACTTC 
AACGCGTCCG CGGTGAACGT CAGGAACGCG GAGGACCGAA AGAAAGTAAG CCGCATCCTG 
GCAGAAGCAG CGAAAAAAGG CCTACCGATG GTGATTCACG TGGGAGGCGG AAACTTCAAC 
GCATCCGACG CAGAGTTGTT CATCACCGAG ATTCTCCCCA GTGCCGGCGA TTCATGGGTA 
CAGATCGCGC ACGCCGGTGG AGGTATGCCG AGCCGCAATG GGAATAATCT CGCGGTCCTG 
CGCACCTTTG GAGACCACAT CGTGAGGAAC GACCCGCGGA CGCGAAGGAT ACTTTTTGAT 
TTGTCATTTG TTCCGGCGCC AGATGACAGC CCACAGGGAT TCGCTCAGGA GATCCGGAGG 
ATCGGGTTTA AACATTTTGT GTTCGGATCG GATTTCAGTG TCCAGATGCC GAGCGACGCG 
ATCGTGAATT TGAAGCGGCT AGGACTGTCA GCGGAAGAGA TGCAGACTTT GAGTCAGAAT 
TGTGCGCCAT GGGCGTGCTG A

Protein sequence

MIGLRRTSVL CIFLALLPFA TAQSSNARAV QSWRADHHMH LSSADLCARL GDCPDCECLK 
SDQPPAVLAA DAIKALDDAH VSKGVILSGA YLYARPSVHL SAGETAKKVR LENEFTAAEV 
AKYPKRLVGF FSVNPLQDSA VEEVRYWGAK SQFAGLKLHF NASAVNVRNA EDRKKVSRIL 
AEAAKKGLPM VIHVGGGNFN ASDAELFITE ILPSAGDSWV QIAHAGGGMP SRNGNNLAVL 
RTFGDHIVRN DPRTRRILFD LSFVPAPDDS PQGFAQEIRR IGFKHFVFGS DFSVQMPSDA 
IVNLKRLGLS AEEMQTLSQN CAPWAC