Gene Paes_2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2091
Symbol
ID	6460513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	2274016
End bp	2275053
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	55%
IMG OID	642726075
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_002016748
Protein GI	194334888
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTC TTGGAATCGA AACCAGCTGC GACGAAACAT CGGCTGCTGT TGTGCAGAAC 
GGCCGGGTCA TCTCAAACAT CATCAGCTCC CAGCTGATCC ACCGTGACTT TGGCGGCGTT 
GTCCCTGAGC TTGCGTCAAG GGAGCACGAG CGTCTGATTG TTTCGGTGGT CGATGCCGCC 
GTGAATGAGG CTAATATACA AAAAAACGAC CTTGATATCA TAGCTGCCAC AGCCGGTCCG 
GGCCTGATCG GGGCCGTCAT GGTAGGGCTC TGTTTCGCAC AGGGAATGGC ATATGCCCTG 
AAAAAACCGC TCGTCCCGGT CAATCACATT GAAGCGCATA TTTTTTCAGC GTTTATCCGT 
GACGACAGCG ATGCTCCTCC GCCTGAAAAC GACTTCATCT CGCTCACCGT TTCCGGGGGC 
CACACCATGC TCTGTATCGT GAATCAGGAT TTGAGCTACA AGGTGATCGG CCGCACGATC 
GACGACGCGG CAGGCGAAGC CTTCGATAAG ACCGGCAAGA TGCTCGGCCT CGACTACCCC 
GCGGGTCCGG TTATCGACCG TCTCGCCAAA GAGGGCAACC CGAAGTTTCA CCACTTTCCC 
AGAGCGCTTA CCGCGCAATC GAGAACCAGC AAAAGCTACA GGGATAATTT CGATTTCAGC 
TTTTCAGGCC TGAAAACCTC GGTGCTCCAG TATATCAGCA CCCATGACAG TGCATACATC 
GAACGCCACC TGTCCGATAT CGCAGCATCG GTCCAGGAAG CCATCACCAG CGTTCTGGTC 
ATGAAAACCA TAGCCGCCGC AGAAAAGTAC GGTATCGACG CCATTTCGGT TGCAGGAGGT 
GTCAGCGCCA ATTCCAGGCT CCGCCATTCC ATGCAGGAAG CCTGCGACCG CCAGGGCATC 
AGGCTCTTCA TCCCCGGCAT CGTCTACTCC ACCGACAACG CAGCCATGAT CGCCACCATG 
GCGAACCTCA AGCTCGAACG CGGAAAAACC GAACCCAACA ACTACGACGT CGCGCCATTT 
GCGAGTTTCA GGGGATGA

Protein sequence

MNILGIETSC DETSAAVVQN GRVISNIISS QLIHRDFGGV VPELASREHE RLIVSVVDAA 
VNEANIQKND LDIIAATAGP GLIGAVMVGL CFAQGMAYAL KKPLVPVNHI EAHIFSAFIR 
DDSDAPPPEN DFISLTVSGG HTMLCIVNQD LSYKVIGRTI DDAAGEAFDK TGKMLGLDYP 
AGPVIDRLAK EGNPKFHHFP RALTAQSRTS KSYRDNFDFS FSGLKTSVLQ YISTHDSAYI 
ERHLSDIAAS VQEAITSVLV MKTIAAAEKY GIDAISVAGG VSANSRLRHS MQEACDRQGI 
RLFIPGIVYS TDNAAMIATM ANLKLERGKT EPNNYDVAPF ASFRG