Gene Gdia_1978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1978
Symbol
ID	6975404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2196895
End bp	2198013
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	643391507
Product	pyrroloquinoline quinone biosynthesis protein PqqE
Protein accession	YP_002276353
Protein GI	209544124
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR02109] coenzyme PQQ biosynthesis protein E

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.633092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCA TGCCTGCCGC CGCCCGCCCT GCCGTTCCCC CGCCGATGAG CCTGCTGGCC 
GAGCTGACGC ATCGCTGTCC GCTGCAATGC CCGTACTGCT CGAACCCGCT GGCACTGGAT 
GGGCGCGAGG GCGAGCTTTC GACCGCCGAG TGGCGTCGCG TCCTGGACCA GGCGGCGGAA 
CTGGGCGTGC TGCAGGTGCA TTTTTCGGGC GGCGAGCCGA TGGCGCGCGC CGACCTGCCG 
GACCTGGTGC GTCATGCCGC CGGGCGCGGG CTGTATACCA ACCTGATCAC ATCCGGCGTT 
CTGCTGACCG AAGCGACGTT CCGTGCGCTG GCCGACGCGG GACTGGACCA TGTCCAGCTT 
TCGTTCCAGG ACGTCGATGC CGCGCCGGCC GAGACGATCG GCGGCATGAA AGGCGCGCAG 
GCGAAGAAGC TGGCCGCCGC GCGCATCGTC GTGGCGGACG GCATGCCGCT GACGCTGAAT 
TTCGTCATCC ATCGCGGCAA TGCCGCGCGC ATTCCCCGCA TGCTGGACCT GGCGGTGACG 
CTGGGCGCCC GGCGGGTGGA AATCGCGCAT ACGCAATATT ACGGCTGGGG GCTGGTAAAC 
CGGGGCGCCC TGATGCCCAC CCGCGCGCAG TTGGACGAGG CCACCCGCGC GGTCGAGGAT 
GCGCGGGCGC GGCTGGGCCC GGCGCTGGCC ATTGATTATG TCACCCCGGA TTACTATGCC 
GACCAGCCCA AGCCGTGCAT GGGCGGGTGG GGGCGACGCT TCGTCAATGT CTCGCCCGCC 
GGGCGGGTCC TGCCCTGCCA TGCCGCCGAG ACGATCAAGG GCGTGCCCAT GCCCGACATC 
CGCGCTGCCG GCCTGGGCGA GATCTGGGCC GACGCGCCGC TGTTCCGCCT GTTCCGCGGC 
ACGGACTGGA TGCCCGAACC CTGTCGCGGC TGCGACCTGC GCGAGCAGGA CTGGGGCGGC 
TGCCGCTGCC AGGCGCTGGC CCTGCTGGGC GACGCGGCGG CGACCGATCC GGTCTGCGCC 
AGATCACCGG CCCATGCGCG GATCACCGAA ATCCTGGACA GCCTGCCGGA CACCCCGCCG 
CAGCTGGTCT ATCGCCGCTT CGGCAATACC CCGGTCTGA

Protein sequence

MTAMPAAARP AVPPPMSLLA ELTHRCPLQC PYCSNPLALD GREGELSTAE WRRVLDQAAE 
LGVLQVHFSG GEPMARADLP DLVRHAAGRG LYTNLITSGV LLTEATFRAL ADAGLDHVQL 
SFQDVDAAPA ETIGGMKGAQ AKKLAAARIV VADGMPLTLN FVIHRGNAAR IPRMLDLAVT 
LGARRVEIAH TQYYGWGLVN RGALMPTRAQ LDEATRAVED ARARLGPALA IDYVTPDYYA 
DQPKPCMGGW GRRFVNVSPA GRVLPCHAAE TIKGVPMPDI RAAGLGEIWA DAPLFRLFRG 
TDWMPEPCRG CDLREQDWGG CRCQALALLG DAAATDPVCA RSPAHARITE ILDSLPDTPP 
QLVYRRFGNT PV