Gene Gdia_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1945
Symbol
ID	6975371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2157605
End bp	2159593
Gene Length	1989 bp
Protein Length	662 aa
Translation table	11
GC content	72%
IMG OID	643391474
Product	peptidase S9 prolyl oligopeptidase active site domain protein
Protein accession	YP_002276320
Protein GI	209544091
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.956519
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGATC CGACCGTCGC GAAGGGGGCG TCCGTCCTGA CGCAGCCCTT TGGCACCTGG 
CCGTCCGCCG TCACCACCGC CCTGGTCGCG GGCAGGACGG TGGGGCTGTC GGCGGTGCAG 
GCCGATGGCG ATGCGATCCT CTGGCTGGAA ACCCGCCCCT CGGAAGCCGG GCGGACGGTG 
CTGGTCCGCT GGACGGCAGG CACCGGCGCG GTCGACCTGA CGCCGCCGCC GCTGGATGTC 
GGCACGCGGG TGCACGAATA TGGGGGCGGG GCCTATGCCG TATCCGGCGG CCGCATCGCC 
TTCAGCCACC GCCCCGACGG CAGCGTCTGG GTGATCGAGG CCGACGGACC CGCGCGGGCG 
ATCAGCACGG TGGCCGGCCT GCGCTTCGCC GATTTCACCT TCGATCCCGC CGGCGCACGG 
CTGTTCTGCG TGCGCGAGGA CCACCGTGCG GGCGGCGAGC CGGTCTCGGC GCTGGTCGCA 
CTTCCCCTGG CGGGCGGCGA CCCGGCCACG CAGGCGGGGC AGGTCCTGGT GTCCGGCCCC 
GATTTCGTCA GCTCGCCTCG CCCGTCGCCC GATGGCGCCC ATCTGGCCTG GATCGAGTGG 
AACCATCCCG CCATGCCGTG GGATGCGACA CGCCTGCGCG TGGGCCGTCT GGAGCGGGAC 
GGCACCCTGG CCGGCGCGCG CACCCTGGCG GGCGACGGCG ATCCTGAATC GGTCATCGAA 
CCCGCCTGGG CCGGCCCACG GGCCCTGTAC GCGGCGTCGG ACCGCAGCGG CTGGTGGAAT 
TTGTGGCGCT TCACCCTGCC GGGCGGCGGC CCCGAACCCG TCGCCCCGAT GGCGGCCGAG 
ATCGGCCTGC CGCACTGGGT GTTCGGCCAA TGCAGCTACC GTCCGCTGCC GGACGGATCG 
ATCCTGGCCA TCGCGATCGA CCATGGCGAG GCGCGGACGA TCCGGATCAA GGACGATCCG 
GACCCGTCCA TGAGGGTCCA TGCCGTGGCA TTCGGCCATC CGGCACAATG CCCGGCCCCG 
CTGGCGGACG GATCGCTGGC GTGGATCGAC ACCCCGCCGG ACGGCCCTCC GGCGGTGGTG 
CACGGCCGCG TGGGCGCGCC GCCGGATACC CTGCGGGCCG CCGCGGTCCT GGACCTGGCC 
CCCGGCGACA TCGCCCGGGC CGAGACGATT CGTTTCCCGC TGCCCGACGC GCCGGGCGGG 
GTGCAGCGGG GCCATGCGTT CTTCTACCCC CCGGCCAGCA GCCGCTTTCG CGGCCCGGCG 
GACGAAAAGC CGCCCCTGAT CGTGATGGCC CATGGCGGCC CGACCGGCCG GGCGAGCGAG 
GCGTTTTCCT TCAAGGTGCA ATGGTGGACC AGTCGCGGCT TCGCCGTGGT GGACGTCAAT 
TACGGCGGAT CGACCGGCTT CGGCCGTGCC TATCGCCGTC GGCTGGAGGG GAAGTGGGGC 
GAAATCGACG TGGCGGACTG CATCGCCGCC TGCCGCTTCC TGATCGAGCA CGGCCGCGTC 
GACCCCCATC GCATCGCCAT TCGCGGCAGC AGCGCCGGGG GGCTGACGGT GCTGCTGGCG 
CTGGCGCGGT CCAGCCTGTT CGCCGCCGGG GCCAGCCTGT ACGGCGTCAC CGACCTGCGC 
GCCCTGGCGC AGGAAACCCA CAAGTTCGAA TCCCGCTATC TGGACAGCCT GGTGGGCCCC 
TATCCGGCGG CCGAGGCCAC CTACCTGGCC CGCTCGCCCC TGACGCAGGC CACGGGAATC 
CAGGTCCCGG TACTGTTCCT GCACGGGCTG GACGACGCCG TCGTTCCGCC CGGACAGGCC 
CGCGCCATGG CAACGGCCCT GTCCGGCAAC GCCGTGCCCC ATGCCCACTA TGAATTTCCC 
GGCGAAAGCC ACGGCTTCCG GCGCGAGGCC ACCATACGCC GCGCGCTGGA CCTGGAACTG 
GATTTCTATG GACAGGTGTT CGGCTTCACG GTTCCGGATG TCAGCGAACG GGTGGTCATG 
CGGTCCTGA

Protein sequence

MTDPTVAKGA SVLTQPFGTW PSAVTTALVA GRTVGLSAVQ ADGDAILWLE TRPSEAGRTV 
LVRWTAGTGA VDLTPPPLDV GTRVHEYGGG AYAVSGGRIA FSHRPDGSVW VIEADGPARA 
ISTVAGLRFA DFTFDPAGAR LFCVREDHRA GGEPVSALVA LPLAGGDPAT QAGQVLVSGP 
DFVSSPRPSP DGAHLAWIEW NHPAMPWDAT RLRVGRLERD GTLAGARTLA GDGDPESVIE 
PAWAGPRALY AASDRSGWWN LWRFTLPGGG PEPVAPMAAE IGLPHWVFGQ CSYRPLPDGS 
ILAIAIDHGE ARTIRIKDDP DPSMRVHAVA FGHPAQCPAP LADGSLAWID TPPDGPPAVV 
HGRVGAPPDT LRAAAVLDLA PGDIARAETI RFPLPDAPGG VQRGHAFFYP PASSRFRGPA 
DEKPPLIVMA HGGPTGRASE AFSFKVQWWT SRGFAVVDVN YGGSTGFGRA YRRRLEGKWG 
EIDVADCIAA CRFLIEHGRV DPHRIAIRGS SAGGLTVLLA LARSSLFAAG ASLYGVTDLR 
ALAQETHKFE SRYLDSLVGP YPAAEATYLA RSPLTQATGI QVPVLFLHGL DDAVVPPGQA 
RAMATALSGN AVPHAHYEFP GESHGFRREA TIRRALDLEL DFYGQVFGFT VPDVSERVVM 
RS