Gene Gdia_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1017
Symbol
ID	6974414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1143198
End bp	1146524
Gene Length	3327 bp
Protein Length	1108 aa
Translation table	11
GC content	58%
IMG OID	643390539
Product	ATPase (AAA+ superfamily)-like protein
Protein accession	YP_002275415
Protein GI	209543186
COG category	[R] General function prediction only
COG ID	[COG1483] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGACG AACAGAAAGA AACCCTGCTT CGCGTTCAGA ACGGGCTTTA TCACCTGCAG 
CGTGGCCTTT ACCCCTTCAT CGAGCAGCAC ATGGCGAACA GGCATGGCGC GAAATGGCTG 
CATTATGCCA GCCGCGCCGC CGGTTCTGGC CCGAATGACG GGCTGGATGC GTACGGGCTG 
GTCAAGACCA TGCTGGATAA CTGGCGTGAA GTGTTTGACG AGGCTTTTCC ATTCCGTGAG 
AAGCACAATG CACGCCGCTA TGCGTCCGCT GCCCTGATGG CACGGAATGC CGTCTCGCAT 
AATGTCGGCT CTCTCCCAGA TAGCGATGCA CTCAGTTACC TGGATCAGAT TCTGCGCCTT 
CTGAAAGTCA CGCAGGCCCC GTCCGAGGAT GTTGAAGCTG TGCAGAAGCT CTATGATGAG 
CAACGCCGTT CCGGGATTGT GCCGGAAACC ACTCCTGCGC AGGCTTCCGC ATCGGCTCCG 
GTCCCGGCTA ACGCGGAAAT AGCCTTTCCC GCTCCGGCTG AGGGCAAGCG TCTTACACCG 
TGGGTCGATG TAGCGCTCCC TCATCCGGAT GTATTGGCCA ACCGCTTCCG CCAGTCTGAA 
TTCGCCGCCG ACCTGGGCGC TGTCGATGCG GGAGACGCTG CGGAGATCAG CGAGGATTAT 
GCGACGCCGC TTGGGTTTTT CCGCATCACG TTCATGACGG AGGGTCTGCG CCGTGTGCTG 
TTCTCCGTGA TGCAGCGTCT CGCGGGACAG GGCGGCGATC CGGTCATCGG ACTTCAGACA 
AGCTTCGGTG GCGGCAAGAC GCACACAATG CTGGCGATCT ACCATCTCGC AAGGGCACTG 
GCTGAAGGAC ATAAGCCGGA AGATCTGGCC GGGATCGGAG AAATTGCCGA ACCCCTGCGT 
GGTGTTGTGT GGCCGAAACC GGCGCGGGCG GTATTTGTCG GCTCGTCGAA GGGACCGGAT 
GTTCCGCTGA CACGCGGCAA GGAACCTGTC ATCCGTACGC TCTGGGGATA CCTCGCCTGG 
CGTCTTGCCG GAGAAGCCGG TCTGGCTCTC ATGCGGGAAG CCGAAGCCGC CTGGACCAAT 
CCCGGAGCCG ATCTGCTTGT CGATCTGTTC CGCCTGAGCG GCCCATCTGT CATTCTGATT 
GATGAACTCA CCATGTTTGC CCGGCAGTTA CCTGACGGGC GTTTCGAGGC TCTGCTGTCC 
TTCATTCAGT CTCTGACGGA AGCGGCTGCC CGCACCCGCG ATATTGTGGT CGTGGGGTCG 
TTGCCGGAGA GCCGAGCCGA AGCTGGCGGA GAAAAAGGAG CTGCCGCCCT GCTGCGGCTG 
GAGAAGGTAT TCGGACGCGT TCAGAGTGCC TGGCTACCGG CATCAGGCGA CGAGACGTAC 
GAGATCGTAC GGCGACGTCT GTTTCAGCCC CTGGATTCTG AAGGGGAAAA GGTGCGGGAC 
GCCACGGTTG CAGCCTTCGC GCGAATGTAT CGGGAGAACA AGGCTGAATT TCCGCCAGAG 
GTTCATGAGG CCCGTTATGC TGACCTTCTA AAGCTTGCTT ATCCCATTCA TCCGGAATTA 
TTCGGCAGAC TGTCCCGCAA CTGGGCGACG CTGGAGAAAT TCCAGAGAAC GCGTGGTGTT 
CTCCAGTTCA TGGCGGGCGT GATCGGCGTT CTGTGGAAGG AGCGCACGCC TGATCCACTG 
ATCACCCCGG CTCGCGTCCC GGTCGGACAT GAGCGGGTTC GTGTCAGCGT GCTCTATCCT 
CTTGATCCTG CCTTTGGTGC TGTCGTGGAC GCGGAAGTGG ATGGAGAGGG CTCATTGTCT 
TCCCGTATGG AGGCCAATCC ACAGCGACGG ATCACCCAGG CACGTGCGGC GACACGCGTC 
GCCCGCTCAA TCTTCATGTG TTCAGCACCT ACGGTCGGGT TGCCGAACGC GGGAGTCTCC 
GGCCCTTCAA TCCGGCTTGC CTGTGCTGAA CCGGGAGATC AGCTTGCTGT CTTCGGCGAA 
GCGCTGCGGG AGCTTTCTGA ACGGGCAACG TATCTATACG ACGAGGCCGG CCGCTACTGG 
TTCGCGACAC AGCCAACACT GAACCGGCTG GCTGATGATC GGGCAAAGAC GCTGCCCGCG 
TATGAGGTAG ATGATTGGAT TGTAAGCCGA CTGCGGGAGG ATACGAAACG CAAGGAGCAT 
TTCGCGCGCG TGTATACCGC GCCAGATGAG CCGAGTGCGA TGGACGAGAC GCGGGATATG 
TCTCTCGTCG TATTAGGGCC GGCTTATGGT CATCTGGGAC GAAGCATTAC AGAATCCGCC 
GCAGTCGTGG CTGTGCAGGA CGCGCTTCTG CGATGCAGAA CGACACAGCG GCGCTTTCGA 
AATACGCTGA TCTTCGTCGC TCCTGACGAA AACGAGCTCT CTAAGGCCCG CGACGTCGCG 
GCGAGAGCAA TGGCGTGGCA GTCCATTGTT GACGATAAGG TTGTCACCGC ACAGCTTACA 
GGTGCGCAGA GAGAAGATGC TGCATCAAAG TCAAAACAGT ACAGGGAAGC GACGGAACGT 
GCGATCCGCA CAGCGTGGTG TCACGTCTTC TATCCGATCA GCAGCGACGT TGCGGGACAG 
GCGTTCAAAC TCGAACAGCA GGTTCTTGCT AACCGGGGTG ACAAGCCAGT CGCCGTCGCG 
GTCTATGACC GGCTGAAGCC TGGTGGTGAA GGGATCATCA AGGAAAAACT TGGCGCTGAG 
AATTTCCGTG TCGTGCTGCA GGGCATCTGG CCTGACGACC GATCTTGGCT TTCCGTCGCC 
GAAATCATCG ACTGGTTCGC GACCTTCGTC TATCTGCCGA AATTGCGTGA TGGTGTCGTG 
CTGGAACAGG CCATTGCGGA TTCAGTATCT CGAATGGGAG CGGCATTCGG TTTCGCAGAT 
CGGTGGGATG AGGAGAAGAA ACGGTTCATA AACCTTGTGT TTGAAAGAAC CTTGACCGTC 
CCGGCTCGGG ATGGCGTGCT TGTTCGTGCC GAGGAAGCAC GGCAGCAGAA CGACGCCGAA 
CTTCCCTCGC CGAGTTCTTT GCCTGCGCCG AATTCAGACG GCAAGCCGTC AACAATTTCT 
GGGACTGGGC ATACCACGTC GGCTCCTAAG CAAACGCGAC CTACGAGGTT TTATGGAAGT 
GTCACGCTGG ATACACTTCG GACGGTGAGG AACGTCGAAA CGATACTGAC GTCAGTCGTT 
GCTGAATTAC AGCGCACACC GGGAGTGCGT GTTACGTTGA CGCTGGACGT TGAAGCCGAA 
AGCGATGATG GCTTTGACCC TGAAGATATC AGCGTCGTTC GTGACAATAC TATACAACTC 
AAATTCAAAT CCATGGGGTT TGAATAA

Protein sequence

MSDEQKETLL RVQNGLYHLQ RGLYPFIEQH MANRHGAKWL HYASRAAGSG PNDGLDAYGL 
VKTMLDNWRE VFDEAFPFRE KHNARRYASA ALMARNAVSH NVGSLPDSDA LSYLDQILRL 
LKVTQAPSED VEAVQKLYDE QRRSGIVPET TPAQASASAP VPANAEIAFP APAEGKRLTP 
WVDVALPHPD VLANRFRQSE FAADLGAVDA GDAAEISEDY ATPLGFFRIT FMTEGLRRVL 
FSVMQRLAGQ GGDPVIGLQT SFGGGKTHTM LAIYHLARAL AEGHKPEDLA GIGEIAEPLR 
GVVWPKPARA VFVGSSKGPD VPLTRGKEPV IRTLWGYLAW RLAGEAGLAL MREAEAAWTN 
PGADLLVDLF RLSGPSVILI DELTMFARQL PDGRFEALLS FIQSLTEAAA RTRDIVVVGS 
LPESRAEAGG EKGAAALLRL EKVFGRVQSA WLPASGDETY EIVRRRLFQP LDSEGEKVRD 
ATVAAFARMY RENKAEFPPE VHEARYADLL KLAYPIHPEL FGRLSRNWAT LEKFQRTRGV 
LQFMAGVIGV LWKERTPDPL ITPARVPVGH ERVRVSVLYP LDPAFGAVVD AEVDGEGSLS 
SRMEANPQRR ITQARAATRV ARSIFMCSAP TVGLPNAGVS GPSIRLACAE PGDQLAVFGE 
ALRELSERAT YLYDEAGRYW FATQPTLNRL ADDRAKTLPA YEVDDWIVSR LREDTKRKEH 
FARVYTAPDE PSAMDETRDM SLVVLGPAYG HLGRSITESA AVVAVQDALL RCRTTQRRFR 
NTLIFVAPDE NELSKARDVA ARAMAWQSIV DDKVVTAQLT GAQREDAASK SKQYREATER 
AIRTAWCHVF YPISSDVAGQ AFKLEQQVLA NRGDKPVAVA VYDRLKPGGE GIIKEKLGAE 
NFRVVLQGIW PDDRSWLSVA EIIDWFATFV YLPKLRDGVV LEQAIADSVS RMGAAFGFAD 
RWDEEKKRFI NLVFERTLTV PARDGVLVRA EEARQQNDAE LPSPSSLPAP NSDGKPSTIS 
GTGHTTSAPK QTRPTRFYGS VTLDTLRTVR NVETILTSVV AELQRTPGVR VTLTLDVEAE 
SDDGFDPEDI SVVRDNTIQL KFKSMGFE