Gene Gdia_3021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3021
Symbol
ID	6976455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	3307703
End bp	3309121
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	68%
IMG OID	643392529
Product	carboxyl-terminal protease
Protein accession	YP_002277366
Protein GI	209545137
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.846777
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.0258031
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTCC GCACCGGCCT GCTGCTTGGT TGCGCCTTTC TGGCAGGTAT CGCCGCGGGT 
CCGCAGATCA CCCACCTTCC CGGCCTGGGG GGTGGCAACC TGACGTCCAA CGCCCTGGCC 
GCCAGCCTGT CGAAGGACAG CGATTCACCG GCCGAGAATT TCCGCCTGCT GTCGCTGTTC 
GGCCACGTGC TGGAACAGGT GAAGGCGAAC TATGTCGATC CGGTCTCGAA TCGCGACCTG 
ATCATCAACG CGCTGAACGG CATGCTGAGC GGCCTGGACC CGCACAGCTC GTACATGACC 
GAAAAGCAGT ACGGCGACCT GCAGGTCCAG ACCAAGGGCG AATTCGGCGG GCTGGGGCTG 
GAGGTGCAGG GCGAGGACAG CCATATCCGC GTCGTCTCGC CGGTCGACGA CACGCCGGCG 
GCGCGCGCCG GGATCAAGCC GGGCGACTAC ATCGTCGCGA TCGACGGCAA GAACATCGAC 
GGCCTGCCGC TGGACGAGGC CGTGGGGCGC ATGCGCGGCA AGCCGGATAC CAAGATCACC 
CTGACCCTGA TCCGGGAAAA GACGCCCAAG CCGATCGTCG TGACCATGAC CCGCGCGATC 
ATCCATATCC AGGTCATCCG ATCGGCGCTG TACGACACGG TGGGCTACAT CCGCGTCTCG 
CAGTTCAACG AGGAGACCGG CCCGGGATTG GAAGCCGCGT TCCGCAAGCT GAAGGACGAA 
GCCCACGGCC ACCTGACCGG GCTGGTGCTG GACCTGCGGT CCGACCCGGG CGGGCTGCTG 
AACCAGGCGA TCCAGGTCGG GTCCGATTTC ATCCGCAATG GCGAGATCGT TTCGACCCGC 
GCCCGCCATC CGCAGGAAAG CCAGCGGTGG GACGCGCACG GCACCGACAT CACCGACGAC 
CTGCCGATGG TGGTGCTGAT CAATGGCGGT TCGGCCTCGG CCAGCGAAAT CGTCGCCGGC 
GCGCTGCAGG ACCACCAGCG CGCGGTGGTG GTGGGCGAAA AATCCTTCGG CAAGGGCTCG 
GTGCAGACCA TCCTGCCCAT CCCGGGCGAC GGCGCGCTGC GGCTGACGAC GGCGCGCTAC 
TACACGCCCT CGGGCCGGTC CATCCAGGGG CTGGGCATCG TGCCCGACGT GACAGTGCGC 
GAAACGCGCG AGGACCCGGC CTACAGCATC CGCGAGGCCG ACCTCAGCCA CATCATCAAG 
AACCAGGGCG GCAATACCGC CAAGCCGCCG GCCCGCACCG ACCTGCCCGC CATCGTGTCG 
TCCATCCCCG ACGAGCCGCC GGCGAACTGG CCGTCCTTCG ACCCGACCAA GCCGGCCACC 
GACTTCCAGT TGCAGGAAGG GCTGAAGATC GTCCGCGCGA TGGGAACGGG GCCGCGTTCG 
GCCGCCGCCG CCGTCCCCGC GGCGCCGCGT CATGACTGA

Protein sequence

MTFRTGLLLG CAFLAGIAAG PQITHLPGLG GGNLTSNALA ASLSKDSDSP AENFRLLSLF 
GHVLEQVKAN YVDPVSNRDL IINALNGMLS GLDPHSSYMT EKQYGDLQVQ TKGEFGGLGL 
EVQGEDSHIR VVSPVDDTPA ARAGIKPGDY IVAIDGKNID GLPLDEAVGR MRGKPDTKIT 
LTLIREKTPK PIVVTMTRAI IHIQVIRSAL YDTVGYIRVS QFNEETGPGL EAAFRKLKDE 
AHGHLTGLVL DLRSDPGGLL NQAIQVGSDF IRNGEIVSTR ARHPQESQRW DAHGTDITDD 
LPMVVLINGG SASASEIVAG ALQDHQRAVV VGEKSFGKGS VQTILPIPGD GALRLTTARY 
YTPSGRSIQG LGIVPDVTVR ETREDPAYSI READLSHIIK NQGGNTAKPP ARTDLPAIVS 
SIPDEPPANW PSFDPTKPAT DFQLQEGLKI VRAMGTGPRS AAAAVPAAPR HD