Gene Gdia_3255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3255
Symbol
ID	6976694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	3566208
End bp	3567155
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	72%
IMG OID	643392765
Product	proline iminopeptidase
Protein accession	YP_002277597
Protein GI	209545368
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.189812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACGCC ACGACCTGTT CCCGGACATC GCGCCCTACG ACAGCGGCTA CCTGCCTGTC 
GGCGACGGGC ACGAACTCTA TTGGGAACAG GCGGGCAACC CCGCAGGGCG GACGGTGCTG 
TTCCTGCATG GCGGTCCGGG CGCGGGCGCG GGCGCGGTCC ATCGCCGCTT CTTCGACCCG 
GAACATTGGC GCGTCGTCCT GTTCGACCAG CGGGGGGCCG GGCGGTCGCG GCCGCATGCG 
TCGATCGCGG CCAACACGAC ACCGCACCTG GTGCGCGATA TCGAAACGCT GCGCCAGGCG 
CTGGGCATCG GGGACTGGCT GCTGTTCGGC GGGTCGTGGG GATCGACGCT GGCGCTGGCC 
TACGCCCAGG CGCACCCCGA ACGGGTGCGC GCGATGATCC TGCGCGGGAT CTTCCTGGGC 
CGGCCGCGCG AACTGGACTG GTTCTTCCAC GGCCTGGCCC ATGTCTTCCC CGACGCGCAC 
GCGGCCTTCC TGTCGCACCT GCCCGAAGCG GAACGGGATG ATCCGCTGGG CGCCTATGGC 
CGGCTGCTGT TCGATCCCGA CCCCGCGATC CACCTGCCGG CGGCGCGGGC CTGGTCGGCC 
TACGAGGGAA CGTGCTCGAC GCTGATTCCC GCCCCCGCCG CCGTCGCCGG CTTCGCGCAG 
GACCGCGCCG TCATCGGCCT GGCGCGGATC GAGGCCCATT ATTTCCGGCA CGGCCTGTTC 
CTGCCGCCCG AGGGCCTGCT GGGCGCGATG GAGCGGATCG CGCATATTCC CTGCACCATC 
GTCCAGGGCC GGTATGACAT GATCTGCCCC AGCGAGTCCG CCTGGGACCT GTCCCGGCAC 
TGGCCGCGCG CCACCCTGGT CATGGTGCCG GATGCCGGGC ACTCGGCCCT GGAACCGGGC 
ATCCGCCGCC GGCTGGTCGC GTGCGTCGAG GAGATGCGCG ACGCATGA

Protein sequence

MPRHDLFPDI APYDSGYLPV GDGHELYWEQ AGNPAGRTVL FLHGGPGAGA GAVHRRFFDP 
EHWRVVLFDQ RGAGRSRPHA SIAANTTPHL VRDIETLRQA LGIGDWLLFG GSWGSTLALA 
YAQAHPERVR AMILRGIFLG RPRELDWFFH GLAHVFPDAH AAFLSHLPEA ERDDPLGAYG 
RLLFDPDPAI HLPAARAWSA YEGTCSTLIP APAAVAGFAQ DRAVIGLARI EAHYFRHGLF 
LPPEGLLGAM ERIAHIPCTI VQGRYDMICP SESAWDLSRH WPRATLVMVP DAGHSALEPG 
IRRRLVACVE EMRDA