Gene Gdia_0458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0458
Symbol
ID	6973852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	504071
End bp	505204
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	68%
IMG OID	643389990
Product	peptidase M50
Protein accession	YP_002274869
Protein GI	209542640
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0639554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.134701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATGGT CGATCCCCCT GGGGCGCATC GCGGGCACCG CAATCCGCGT GCATGTGACG 
TTCTTCCTGC TGTTGCTGTG GATCGCGATG GTCGCCGGTG CCCAGGGCGG CCCTGCGGCG 
GCGTGGCAGG GCGTGGTGTT CATCATGCTG GTCTTCGTCT GCGTGGTCCT GCATGAATTC 
GGACACATCC TGATGGCACG CCGTTTCGGC GTGACGACAT CCGACATCAC CCTGCTGCCG 
ATCGGCGGCG TCGCGCGCCT GTCGCGCATG CCCGAACGGC CGGGGCAGGA ATTGCTGGTG 
GCGCTGGCGG GGCCGGCGGT CAATCTGGTC ATCGGCCTGC TTCTGTTCGC CGCGACGGGA 
ACGTGGCCCA GCCTGGATGC CGCGACGAGC GGGATGGTGG GCGGCGGCGG GATGGTCGTC 
CGTCTGGCCT CGGTCAATCT GTTCCTGCTG CTGTTCAACC TGCTGCCGGC CTTTCCCATG 
GATGGGGGGC GGGTGCTGCG CGCGCTTCTG GGCTATCGGA TGGGTTTCGT GCGGGCGACG 
CAGGTCGCAG CCTCGGTCGG GCAGGGGTTT GCGTTCCTGC TGGGCTTCCT GGGGCTGATC 
GGCAATCCGA TCCTGCTGTT CATCGCCCTG TTCGTCTATC TGGGCGCCGC GTCGGAGGCC 
CATATGGTGC AGTTGCGCCA GGTGGCGCAG GGGATGATCG CGGCGGATGC CATGATGACC 
CGGTACGAGA CGCTGCCGAC GCTCACGACG CTGGACGAGG CGGTACGGGC CGCGATCCGC 
TGCGCACAGA CGCTGTTTCC CGTCATGGAC GGGCAGGGCA GGCTACAGGG CGTGCTGACG 
CAGGCGGCCT TGATCAACCA TCTGCAAATA GACGGGCCCG GCGCGGTGGT GGCCGATGCC 
ATGACGCCGG CCATCCCCGC CATCCATCCC TACCAGCCGC TGTCGGAGGC ACTGCGCCTG 
TTGCAGGAGG GCAACCTGCC GGCCGTCGCG GTGGTCGACG CCGGCGACCG CCTGGTCGGC 
CTGATCACGT CCGAGACGAT CGGCGAACTG ATGTTGACTC ACGGGATACG CGTAACGCAG 
GGGCGGCGCG CGGCCGATTC CGATCGCCCC CCGACCGACC GGGCCGCCGC CTAG

Protein sequence

MTWSIPLGRI AGTAIRVHVT FFLLLLWIAM VAGAQGGPAA AWQGVVFIML VFVCVVLHEF 
GHILMARRFG VTTSDITLLP IGGVARLSRM PERPGQELLV ALAGPAVNLV IGLLLFAATG 
TWPSLDAATS GMVGGGGMVV RLASVNLFLL LFNLLPAFPM DGGRVLRALL GYRMGFVRAT 
QVAASVGQGF AFLLGFLGLI GNPILLFIAL FVYLGAASEA HMVQLRQVAQ GMIAADAMMT 
RYETLPTLTT LDEAVRAAIR CAQTLFPVMD GQGRLQGVLT QAALINHLQI DGPGAVVADA 
MTPAIPAIHP YQPLSEALRL LQEGNLPAVA VVDAGDRLVG LITSETIGEL MLTHGIRVTQ 
GRRAADSDRP PTDRAAA