Gene Gdia_0594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0594
Symbol
ID	6973991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	665317
End bp	666759
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	68%
IMG OID	643390125
Product	amidohydrolase
Protein accession	YP_002275001
Protein GI	209542772
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00251478
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGAAC AGTGGGGCCG GAAAACGTTC AATAGCGGGA AGGAAGCGGG CATGACCATC 
GCAGGACGGT TCGGCTGGGC GCTGTCGCTG ATGTTATGCG CCGGTGCAGC CAACGTGGCC 
GTGGCGGCGG AGGCACCGGC GGTGCTGCTG GAGCACGCGA CGCTGATCGA CGGCACCGGG 
GCGACGCCCG TGGCCGACAG CGCGGTCCTG ATCCGGGACG GCCGGATCGC TTCGGTGGGG 
CGTGACGGCA CGATCGCCGT GCCGGCGGGC GTGAAGACGG TCGATCTGGT CGGGATGACC 
ATCCTGCCGG GCCTGATCTC GGACCACAGC CATACCGGGC TGGTGAAGGG CACGCAGGAC 
GACACGGCCA ATTATACGCG CGAGAATATC CTGGCGGCCC TGAAGCAGTA TGAACGCTAC 
GGCGTGCTGT CCGTGGTGTC GCTGGGCCTG AACAAATCCC CGCTGTTCGA CCAGTTGCGG 
CAGGAACAGC ACGCGGGCCG CAATCCGGGC GCCGACCTGT TCGGCGTGGA CCAGGGGATC 
GGCGCGCCGG ACGGCGTGCC GCCACAGGGC ATGTTCCATC TGGGTGCCGA TCAGGTCTAT 
CGCCCGACCT CGGTGCCCGA GGCCCGCGCC GCCGTCGATC GCATGGTCGA CGAGGGCACG 
GACCTGGTGA AGATCTGGGT GGACGATTTC CGCAACGGCG TGCCCGGCGC CAAGGGATTC 
CCCAAGATCG ATCCCGCGAT CTATCGCGCG GTGATCGAAC AGGCCCATGC GCGCGGCAAG 
CGCGTCGCGG CGCATATCCA TGACCTGGCC GACGCCAAGG CGCTGGTGGC GGCCGGGGCC 
GACATCGTTG CCCACGGCGT GCGCGACCAG CCGGTCGATA CCGATTTCAT CATGCTGATG 
GAACAGAAGG GCGCGTGGTA TATCGCCACC CTGGACCTGG ACGAGGCGAA CTACATCTTC 
GCCCTGCACC CGGAATGGCT GGACGATCCG TTTCTGTCCG CCGGCCTGAA CCCCGCCCTG 
CGGGCCCGGT TCGCCGACCC GGCCTGGCGG GCCAAAATCC TGGCCGCGCC GCTGACCGAA 
GCGTCGAAGA GGGCGGTGGC GCTGAACCAG CGCAACCTGA TGACCCTGTA CCGCGCGGGC 
ATTCCTATCG GCTTCGGCAC TGATTCCGGG GCATCGGCCA CGCGGATTCC CGGTTTTGCC 
GAACATCGCG AACTGAAGCT GATGGTCGCG GCGGGCATGA CGCCGGTCCA GGCCCTGACG 
ATCGCAACGG GCCGCGCCGC CGCCCTGATG CAGTGGGACG ACCGGGGTAT CCTGCTGCCG 
GGCCGGTGGG CCGACCTGGT CGTCGTGTCC GGCGACCCGG CCCATGACAT CACGGCGGTC 
GACAGGATCG CCCAGGTCTG GCATCGCGGC GTACAGACCG AAGGCGCGCT GATTCCACAA 
TAA

Protein sequence

MAEQWGRKTF NSGKEAGMTI AGRFGWALSL MLCAGAANVA VAAEAPAVLL EHATLIDGTG 
ATPVADSAVL IRDGRIASVG RDGTIAVPAG VKTVDLVGMT ILPGLISDHS HTGLVKGTQD 
DTANYTRENI LAALKQYERY GVLSVVSLGL NKSPLFDQLR QEQHAGRNPG ADLFGVDQGI 
GAPDGVPPQG MFHLGADQVY RPTSVPEARA AVDRMVDEGT DLVKIWVDDF RNGVPGAKGF 
PKIDPAIYRA VIEQAHARGK RVAAHIHDLA DAKALVAAGA DIVAHGVRDQ PVDTDFIMLM 
EQKGAWYIAT LDLDEANYIF ALHPEWLDDP FLSAGLNPAL RARFADPAWR AKILAAPLTE 
ASKRAVALNQ RNLMTLYRAG IPIGFGTDSG ASATRIPGFA EHRELKLMVA AGMTPVQALT 
IATGRAAALM QWDDRGILLP GRWADLVVVS GDPAHDITAV DRIAQVWHRG VQTEGALIPQ