Gene Cag_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0109
Symbol
ID	3747597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	123241
End bp	124293
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	50%
IMG OID	637772635
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_378430
Protein GI	78188092
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAATAC TTGGAATTGA AACCAGTTGC GATGAAACCT CAGCCTCCGT GCTCCATAAC 
GGCGTGGTGC TGTCGAACAT TGTAAGCTCG CAACATTGCC ACACTTCGTT TGGCGGCGTG 
GTGCCCGAAC TTGCTTCTCG CGAACATGAG AGGCTTATTA CCGCCATTAC GGAGACGGCA 
ATAAATGAGG CAAATATACA AAAAGATGCG CTTGATGTTA TAGCGGCAAC GGCTGGACCG 
GGGTTAATTG GGGCAATTAT GGTGGGCTTG TGCTTTGCGC AAGGCATGGC GTGCGCCTTA 
AACATTCCCT TTGTGCCCAT TAATCATATT GAAGCGCACA TCTTTTCCCC CTTTATTAAT 
AGCGGCGCAA ACAGCCCGCT TCCCAAAGAG GGCTACATTT CTCTGACGGT ATCGGGTGGG 
CACACCTTGC TTGCCCTTGT AAAACCCGAT CTTTCCTACA CGATTGTTGG AAAAACGCTG 
GATGATGCCG CTGGTGAGGC GTTTGATAAA ACGGGAAAAA TGATCGGGCT TCCCTATCCT 
GCTGGACCCG TTATTGATAA ACTTGCCGAA AATGGTAATC CCAATTTTTA TCACTTCCCT 
CGCGCCTTAA CGTCGCGCTC AAAGAGCCGC AAAAGCTGGG AAGGCAACCT CGACTTTAGC 
TTTTCGGGCA TGAAAACCTC TGTGCTTACA TGGTTGCAGC AGCAAAGCCC AGAGAGCGTT 
GCTTCCAACC TCCCCGATAT TGCCGCCTCC ATTCAAGCAG CTATTGTGGA TGTATTAGTA 
GAAAAAAGCA TTGCCGCAGC TAAGCACTAC AACGTAAGCA CCATTGCCAT TGCAGGCGGC 
GTTAGTGCTA ACCGAGGATT ACGCAGCTCC ATGCAAGCCG CCTGCCAGCA ACACGGCATT 
ACCCTCTGCC TACCTGAAAC CATCTACTCA ACCGATAACG CCGCTATGAT TGCAAGCATT 
GCTGCACTCA AGCTCTCGCA TGGTATGGAA CCACTGTACC GCTATAACGT GGCACCCTAT 
GCAAGCTTTT TACACAAAGA CAACTTTTCG TAG

Protein sequence

MIILGIETSC DETSASVLHN GVVLSNIVSS QHCHTSFGGV VPELASREHE RLITAITETA 
INEANIQKDA LDVIAATAGP GLIGAIMVGL CFAQGMACAL NIPFVPINHI EAHIFSPFIN 
SGANSPLPKE GYISLTVSGG HTLLALVKPD LSYTIVGKTL DDAAGEAFDK TGKMIGLPYP 
AGPVIDKLAE NGNPNFYHFP RALTSRSKSR KSWEGNLDFS FSGMKTSVLT WLQQQSPESV 
ASNLPDIAAS IQAAIVDVLV EKSIAAAKHY NVSTIAIAGG VSANRGLRSS MQAACQQHGI 
TLCLPETIYS TDNAAMIASI AALKLSHGME PLYRYNVAPY ASFLHKDNFS