Gene Paes_0112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_0112
Symbol
ID	6458526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	114369
End bp	115487
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	56%
IMG OID	642724099
Product	hydrolase, peptidase M42 family
Protein accession	YP_002014819
Protein GI	194332959
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID	[TIGR03106] hydrolase, peptidase M42 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.294228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACTA TCGATACCGA ATACCTCAAA ACAACCCTCC TGAAACTGCT CGACATTCCA 
AGCCCGACCG GCTATACCGA TGAAATCGTC CACGCTGTCG GCAGGGAGCT GGAACGCATG 
GGGGTCCCGT TCGAACTCAC CCGCCGCGGA GCGATCCGTG CAACGCTCAA GGGGGCGCAG 
CCAAAACTTG ACAGGGCTAT CGTCTCGCAC CTCGACACAC TCGGCGCCAT GGTGAGAGAA 
CTCAAACCCA ATGGCAGGCT GGGAATCATG ATGATAGGCC ACTGGTCGGC CAGATTTGCT 
GAAGGCGCGA GAGTCACCAT CTTTACCGAT AAACGCTCCT TCCGCGGCAC GATCCAGCCT 
CTCAAGGCAT CCGGGCACGT CTACAACGAC GAGATAGATA CCCAGCCAGT CTCATGGGAC 
AATCTTGAGG TACGGATCGA TGAAAAACTC TCTACCCGGG AAGATCTCGA AGCGCTCGGC 
TTCAATGTAG GCGACTTCAT TGCCGTGGAC AGCAGCCCGG AACTCACCTC CAGCGGATTC 
ATCAAGGCAC GCCATCTCGA CAACAAAGCC GGTGTTGCCT GCCAGCTCAC GACAATCAAG 
GCGATCGTTG ACGCAGGCAT AACACTTCCT GTCACCTGCC ACCCGCTCTT TACCATCTCC 
GAAGAAGAAG GGACAGGCGC CTCGTCGATT CTGCACGGCG ATGTCGCCGC CATGGTCGCT 
ATAGACAATT CAACGGTCGC ACCGGGGCAG AACTCCAGGG AAGACAGCGT TACCATCGCC 
ATGCGCGATC AGGGCGCGAT CTACGATTAC CACCTCACCC ATCGTCTTAT CAGCCTCTGC 
GAAGACAACG CCATTCCCTA TGTCCGCGAT GTTTTCCGCC ATTACAGGTC TGACGCTGCT 
TCTGCACTCT CTGCCGGAAA CGATATCCGC ACCGGGCTTA TCTGCTTCGG GCTGGATGCT 
TCGCACGGCC ATGAAAGAAC CCATATCGAT TCACTCATAG CCATCTCCCG GCTTCTATGC 
GCCTACCTGC AAAGCACCCC GAGAATCAAG CACGACAGCA ACAAACTCGG GCCGCTGGAA 
GGCTTTCCAA TGCTTTCAGT CAACAAAAAA ACGCGTTAA

Protein sequence

MITIDTEYLK TTLLKLLDIP SPTGYTDEIV HAVGRELERM GVPFELTRRG AIRATLKGAQ 
PKLDRAIVSH LDTLGAMVRE LKPNGRLGIM MIGHWSARFA EGARVTIFTD KRSFRGTIQP 
LKASGHVYND EIDTQPVSWD NLEVRIDEKL STREDLEALG FNVGDFIAVD SSPELTSSGF 
IKARHLDNKA GVACQLTTIK AIVDAGITLP VTCHPLFTIS EEEGTGASSI LHGDVAAMVA 
IDNSTVAPGQ NSREDSVTIA MRDQGAIYDY HLTHRLISLC EDNAIPYVRD VFRHYRSDAA 
SALSAGNDIR TGLICFGLDA SHGHERTHID SLIAISRLLC AYLQSTPRIK HDSNKLGPLE 
GFPMLSVNKK TR