Gene Cag_0903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0903
Symbol
ID	3748094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1237181
End bp	1238410
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	51%
IMG OID	637773435
Product	peptidase M20D, amidohydrolase
Protein accession	YP_379211
Protein GI	78188873
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAG AAGAGAGCCA TCACCCCATA GCCGAAGCCA TTCAGCACAA AGCTGCCGAA 
TTATTTCCTG AAGTTGTAGC CCTACGCCGC GACATTCATG CCCATCCCGA ACTCTCGCTG 
CAAGAGCACC GCACCACAGC GCTTATTACC AGCTACCTTA TGCAGCTTGG CATTACGCCC 
GAAAAACCCC TGCTCGACAC GGGCGTTATT GCACTTATTC GAGGTACGTC GCCCCACCAC 
CACGGCAAAG TGATAGCATT GCGTGCCGAT ATTGATGCGC TTCCTCTCCA AGAAGAAAAC 
TCGACGGACT ATTGCTCAAT TGAAGCAGGC AAAATGCACG CTTGCGGGCA CGACATGCAC 
ACCGCCATGC TTCTTGGCGC TGCAAAAATT CTTTCGGGCA TGAAAGAGCA ACTTGCTGGC 
GATGTTCTCT TAATTTTTCA ACCATCCGAA GAAAAAGCAC CTGGTGGTGC TCGTCCACTG 
CTTGATGCAG GACTTTTTGC CACCTATAAG CCCATTCTCA TTTTGGGACA ACACTGCTTT 
CCCACCATAG AGTGCGGCAG CGTAGCATTT TGCCGAGGTG CTTTTATGGC GGCAGCCGAT 
GAACTCTATA TTACGGTTAA CGGCAAAGGT GGGCACGCCT CAGCCCCGCA CAAAGCCGCC 
GATCCCGTGT TAGCCGCCGC TCACATGGTA ACCGCCGTGC AACAGCTTGT AAGCCGTGTA 
GTGCCACCCC ACGAAGCCGC CGTTGTTACC ATTTCAGCCA TTAATGGCGG TCATGCAACC 
AACGTAATTC CACGCCAAGT AACCATGATG GGCACTATGC GTAGCATGAA CGAAGAGGTA 
CGCGCTATTT TGCAAGAACG GTTACAGCAA GCCATTACCC ACACTGCACA AGCCTTTGGT 
GTAGAAGCTG AGCTTACTAT TGTAAAAGGC TACCCCGTGC TTTACAACAA CCAAACCATT 
ACCGACCAAG CCTCCTGCAT TTGCGCCGAA TATCTCGGTC ATCATCAAGT GCAGCATTGC 
CAACCCTTGA TGACCGCCGA AGACTTTGCA TATTATTTGC AAGAGTGCCC CGGCACATTT 
TGGCAAATTG GCACAGGTGT GCGCGAAGGC GAAACCGCAA ATACCCTCCA CTCCCCCACC 
TTTAACCCCA ACGAAGAGGC TCTTCAAGTT GGTACAGGGT TGCTTGCATA CAACGCTTAT 
CGTTTTCTTG CATCACTACA TGGGGAGTAA

Protein sequence

MKQEESHHPI AEAIQHKAAE LFPEVVALRR DIHAHPELSL QEHRTTALIT SYLMQLGITP 
EKPLLDTGVI ALIRGTSPHH HGKVIALRAD IDALPLQEEN STDYCSIEAG KMHACGHDMH 
TAMLLGAAKI LSGMKEQLAG DVLLIFQPSE EKAPGGARPL LDAGLFATYK PILILGQHCF 
PTIECGSVAF CRGAFMAAAD ELYITVNGKG GHASAPHKAA DPVLAAAHMV TAVQQLVSRV 
VPPHEAAVVT ISAINGGHAT NVIPRQVTMM GTMRSMNEEV RAILQERLQQ AITHTAQAFG 
VEAELTIVKG YPVLYNNQTI TDQASCICAE YLGHHQVQHC QPLMTAEDFA YYLQECPGTF 
WQIGTGVREG ETANTLHSPT FNPNEEALQV GTGLLAYNAY RFLASLHGE