Gene Plut_0158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plut_0158
Symbol
ID	3744589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium luteolum DSM 273
Kingdom	Bacteria
Replicon accession	NC_007512
Strand	-
Start bp	166244
End bp	167290
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	61%
IMG OID	637768197
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_374091
Protein GI	78186048
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.396319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAATAC TCGGCCTGGA AACCAGCTGT GACGAAACCT CTGGCGCAGT CCTTGTCGAT 
GGGGAGGTAC GCTCTAACGT CGTCAGTTCG CAACTCTGCC ACAAAGGGTT CGGCGGCGTC 
GTTCCCGAAC TGGCCTCAAG GGAGCATGAA CGGCTCATCG TTCCGATCAC CGAAGCCGCC 
CTCGCCGAAG CAAATATAAC AAAAAAGGAT ATCGATGTCA TAGCCGCCAC CGCCGGACCG 
GGACTCATCG GTGCTGTGAT GGTGGGACTC TCTTTCGCCC AGTCGATGGC CTGGGCACTC 
GGCGTGCCGT TCGTGGCGGT CAACCATGTC GAAGCCCATA TGTTCTCTCC GTTCATCGAC 
CAAGAGACTG CCGGCGGAGG TCCAATAGGG CCGTTCATCT CGCTCACGGT ATCGGGTGGA 
CATACGCTGC TGGCCATCGT CCGGGAGGAT CTCACCTACC GGATCATCGG CCGCACCCTC 
GACGATGCGG CCGGAGAAGC CTTTGACAAG ACCGGCAAGA TGCTCGGACT CCCCTATCCG 
GCAGGACCGG CCATCGACCG GCTCGCCAAA GAGGGCGATG CCGGCTTCCA CCGGTTCCCG 
CGGGCGCTCA CAAGTCAGTC GCAGACCAGC AGAAGCTACC GCGACAACTT CGACTTCAGC 
TTTTCCGGTC TGAAAACATC CGTCCTCACC TGGCTCAGGA GCCAGAAAGA GGAGTTCATC 
CACGAGCACC GGGCAGACAT TGCGGCATCC ATCCAGGATG CAATCGTCGG CGTGCTCGTC 
GAAAAAGCGG TCGGAGCAGC ACGCCGCCAC AACATCGGGG CCATCGCCGT TGCCGGCGGC 
GTGAGCGCCA ACTCGGAACT CCGACGAGCC ATGGATGCGG CCTGCCGGAA GCACGGCATT 
GCGCTCTTCA TCCCTTCAGC GACCTACTCG ACAGACAACG CCGCCATGAT TGCGACGCTC 
GCCGGACTGA AACTCTCCCG TGGGCTCCAG CCCCTCTGCC GGTACGACAC GGCACCCTTT 
GCATCGTTCA GTGCGGCAGG GAACTAA

Protein sequence

MIILGLETSC DETSGAVLVD GEVRSNVVSS QLCHKGFGGV VPELASREHE RLIVPITEAA 
LAEANITKKD IDVIAATAGP GLIGAVMVGL SFAQSMAWAL GVPFVAVNHV EAHMFSPFID 
QETAGGGPIG PFISLTVSGG HTLLAIVRED LTYRIIGRTL DDAAGEAFDK TGKMLGLPYP 
AGPAIDRLAK EGDAGFHRFP RALTSQSQTS RSYRDNFDFS FSGLKTSVLT WLRSQKEEFI 
HEHRADIAAS IQDAIVGVLV EKAVGAARRH NIGAIAVAGG VSANSELRRA MDAACRKHGI 
ALFIPSATYS TDNAAMIATL AGLKLSRGLQ PLCRYDTAPF ASFSAAGN