Gene Gdia_1817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1817
Symbol
ID	6975239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2013769
End bp	2015448
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	71%
IMG OID	643391342
Product	peptidase M28
Protein accession	YP_002276192
Protein GI	209543963
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.157463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCCC ATCGTCCGCG CGCCGCCCTT GTATCCGCCA TGCTTCTGGC GGCGGCGTCC 
CCCGCGCATG CCGCGTCCCC GTGGGCGCCG ATCGACCCCG GCCGCATGTC GGCCACCATC 
CGCACGCTGG CGTCCGACGC GTTCGCCGGG CGCGCGCCCG CCACGGCCGG TGAGGCGAAG 
ACCGTGGACT GGCTGATCGC CCAGTATCGC GACATCGGGC TGGAACCCGG TGGCGAGAAT 
GGCGGCTGGA CGCAGAGCGT ACCGCTGCTG CGGACCCGGA TCGGCACCCC GGCCCGGCTG 
GACGCCACCA TCAACGGGGC GCCGATGGCG CTGGAGCTGA AGAAGGACAT CTACCTGACC 
ACCCTGTCGC CGGTCACACG CATCAGGGTG GACGCGGCGC CGATGGTCTT CGTGGGGTAC 
GGCGTGAACG CGCCCGAACG CCATTGGGAC GATTACAAGG GCGTGGACCT GAAGGGAAAA 
GTTGCCGTCT TCCTCATCAA CGATCCGGAT TTCGACGCCA GACCGGGCGA GGCGGTGGCC 
GGACGGTTCG GCGGCCGGAC GATGACCTAT TACGGCCGCT GGACCTACAA ATACGAGGAA 
GCGGCCCGAC GCGGCGCCAT CGCCGCCCTG ATCGTGCATG ACACGCCGGG CGCGTCCTAT 
CCATGGACCA CGGTCATCGC GCCGGGCGGC GAGGCCTTCG ACATCGTGCG GCAGGGCGAT 
GCGAACAAGC CGGTGCCGCT GCAAGGCTGG CTGGAGGGCG ACGCCGCGCA CCGCCTGTTC 
GCCCGCGCGG GGCTGGACCT TGCGGCGCTG CGCGTGAAGG CGCGCGACCC GGATTTCCAT 
CCGGTCACGC TGCCCGGTAC GACCCTGACG GCAGACCTGC CGGTCGAAAC CGCGACATTG 
CAGAGCCGCA ACGTGATCGG CAAGCTGACC GGCGCCCGCC ATCCCGACGA GACGGTCATG 
TACGGGGCCC ACTGGGACGC ATTCGGCGTC GGCACGGACG CACAGGGCCG GCAGGTGATC 
CGGCACGGCG CCGTGGATGA CGGATCGGGA ATTGCCGCGA TCCTGGAAAT TGCCCGCGCG 
TTCAAGGCCG GGCATCGGCC GGACCGGACG GTCCTGTTCG CCGCCTGGAC CGCCGAGGAA 
CGCGGGCTGC TGGGTTCGAC GTGGTATGCC GCCCACCCGC TGGCACCACT GGCCAGGACA 
GCGGCGAACT TCACCATCGA CGTCCTGCAG ACCGCCGGCC CGGCCCATAA TGCCTTCATC 
ATCGGCGCGG GACAGGACAC GCTGCAGGAC GACCTGACGG AAGCCGCCCG CGCGCAGGGA 
CGCGTCACGC AGCCCGAGGC CAGGCCCGAA CGCGGTGCCT TCTACCGCGC CGACCACCTG 
CCCTTCGCCC ATGCCGGCGT GCCCGTCGTG GCCATCATGG GCATGGCCGG CCCCTACGAC 
CTGCTGTCCG GCGGCATCCC GGCCGGCGCG GCATGGCTGA AGGCCTACGC CGCCTGTTAT 
CACCAGCCCT GCGACACCTG GGACCCGCAC TGGGACCTGC GCGGCGCGGC GGAAGATGCC 
GCCCTGGTCT ATCAGGTCGG CCGGACCGTC GCGTTCTCGC ACACCTGGCC CCAGTGGAAA 
CCCGGATCGG AATTCGCCGG CATTCGCGCG GCGAGCGCGG CCGAGCGGGG CGAGCCGTAG

Protein sequence

MPPHRPRAAL VSAMLLAAAS PAHAASPWAP IDPGRMSATI RTLASDAFAG RAPATAGEAK 
TVDWLIAQYR DIGLEPGGEN GGWTQSVPLL RTRIGTPARL DATINGAPMA LELKKDIYLT 
TLSPVTRIRV DAAPMVFVGY GVNAPERHWD DYKGVDLKGK VAVFLINDPD FDARPGEAVA 
GRFGGRTMTY YGRWTYKYEE AARRGAIAAL IVHDTPGASY PWTTVIAPGG EAFDIVRQGD 
ANKPVPLQGW LEGDAAHRLF ARAGLDLAAL RVKARDPDFH PVTLPGTTLT ADLPVETATL 
QSRNVIGKLT GARHPDETVM YGAHWDAFGV GTDAQGRQVI RHGAVDDGSG IAAILEIARA 
FKAGHRPDRT VLFAAWTAEE RGLLGSTWYA AHPLAPLART AANFTIDVLQ TAGPAHNAFI 
IGAGQDTLQD DLTEAARAQG RVTQPEARPE RGAFYRADHL PFAHAGVPVV AIMGMAGPYD 
LLSGGIPAGA AWLKAYAACY HQPCDTWDPH WDLRGAAEDA ALVYQVGRTV AFSHTWPQWK 
PGSEFAGIRA ASAAERGEP