Gene Paes_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1044
Symbol
ID	6459935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	1146709
End bp	1147935
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	53%
IMG OID	642725044
Product	amidohydrolase
Protein accession	YP_002015730
Protein GI	194333870
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000210114
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000194036
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGTCAGAAA TTTCACGCGG AACCAGAGAC CGGATCGGCA GTCGGGCAGA TGAGTTATAT 
CCTCTTGTCC GCGATATCCG GCGCGATATT CATCGTCATC CGGAGCTTTC GTTTCAGGAG 
TTCAGGACAA CGGCTCTTGT CAGGGATTAC CTGGAAAATC TCGGCTTTGA ATTCGCGCCC 
CGTTACCTGG AAACCGGCGT CGTGGCGCTG CTGCGATCAC TGAACCCTTC AGCGCAGCAC 
GAGAGGGTGG TGGTTTTGAG GGCGGATATC GATGCTCTTC CTTTGCAGGA GGAAAATATA 
TCTGATTTCT GTTCGGGTGA GGCTGGATGC ATGCATGCAT GCGGCCATGA TATGCATACG 
GCTATTCTTC TCGGGACAGC ATCTCTTCTC AGTGAATTTC GTCATGAGCT CCCGGGCGAT 
ATCCTTTTTG TTTTTCAGCC GGCAGAGGAA AAGGCACCCG GAGGGGCTAA GCCAATGATA 
GAGGCAGGCC TGTTCAGGGA CTATACTCCC GCGATGATTT TTGCTCTTCA CTGTTTTCCG 
CATATCCGCT CAGGCAATGT TGCGCTTCGG GAGGGTAGTC TGATGGCTGC TGCTGATGAA 
CTCTACATTA CGGTGCATGG AGAGGGGGGG CATGCATCAG CGCCGCATAA AGCAGCTGAT 
CCCATTCTTG CTTCCGCTCA TATCATTACC GCGCTTCAGC ATCTTGTCAG CAGGGTTTCT 
TCGCCATATG AGCCTGCAGT CCTGACTATC AGCTCAATTT CCGGCGGGCA TGCAACAAAT 
GTGATTCCAG AGAATGTTGT CATGTCCGGG ACCATGCGAA TCATGAATGA AGAACTTCGT 
TCGACCTTTC ATCATCGCCT GAAGAAAACC GTTGAACAGG TTGCCGATGC TTTAGGGGTT 
AGCGCTGAAC TTGATATTGT GCACGGCTAT CCGGTTCTGG TCAACGATGC CGCAGCTTTT 
GGCCTGGCGC GCGATGCTGC TGAAGAGATG CTCGGCGCCT CACATGTTGA GGAAAGCGAG 
CCATTGATGA CCGCTGAAGA TTTCGCATGG TATCTGCAGG AGTGCCCTGG CGCTTTCATT 
CAGTTAGGGA CCGGACGAAA TGAAGATCGC AAAGGGGACC AGTTGCACTC ACCATACTTC 
GATCCCGATG AAGCGGCCCT GAAGACGGGA ATGGAGGTCA TGAGCTATAC CGCGATAAAA 
GCTCTTGCAC GTCTTGCCGG GGGGTGA

Protein sequence

MSEISRGTRD RIGSRADELY PLVRDIRRDI HRHPELSFQE FRTTALVRDY LENLGFEFAP 
RYLETGVVAL LRSLNPSAQH ERVVVLRADI DALPLQEENI SDFCSGEAGC MHACGHDMHT 
AILLGTASLL SEFRHELPGD ILFVFQPAEE KAPGGAKPMI EAGLFRDYTP AMIFALHCFP 
HIRSGNVALR EGSLMAAADE LYITVHGEGG HASAPHKAAD PILASAHIIT ALQHLVSRVS 
SPYEPAVLTI SSISGGHATN VIPENVVMSG TMRIMNEELR STFHHRLKKT VEQVADALGV 
SAELDIVHGY PVLVNDAAAF GLARDAAEEM LGASHVEESE PLMTAEDFAW YLQECPGAFI 
QLGTGRNEDR KGDQLHSPYF DPDEAALKTG MEVMSYTAIK ALARLAGG