Gene Gdia_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3036
Symbol
ID	6976470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3323540
End bp	3325492
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	65%
IMG OID	643392544
Product	RNA polymerase sigma factor RpoD
Protein accession	YP_002277381
Protein GI	209545152
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.672133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0730738
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAA AGACAGCCGC GGGTTCGGAA GCGACTGCTG GCGATCAGGA CAACGACACC 
ACTCTGCTGG ATACCCAATC CGGAGCCGTC AAGAGACTGA TCGCACGGGG CAAGGAACGG 
GGGTACATCA CCTTCGACGA GCTGAACGCC GTCCTGCCCC AGGATCAGAT GTCGTCGGAG 
CAGATCGAGG ATGTGATGGC GGTCCTGTCC GAAATGGGCA TCCAGGTCGT CGAGAACGAG 
GATAACGACG ACAGCGAGGC CAATCGCGAG GAGAAGGCCG AGGAGGCCGA CACCGAGGGC 
GAGGAAGCCG GGGGTGCCGC GGGCAACGTC GATACCGAGA GCCTGGGCCG TACCGACGAC 
CCGGTGCGCA TGTACCTGCG CGAGATGGGG TCCGTCGAAC TGCTGTCGCG CGAGGGCGAA 
ATCGCCATCG CCAAGCGGAT CGAGGCCGGC CGCGACGAGA TGATCGGCGG CCTGTGCGAA 
AGCCCGCTGA CCTTCCGCGC CATCATTTCG TGGCACGAGC GCCTGAAGGC GGGCGAGATG 
CTGCTGCGCG ACATCGTGGA CCTGGAGGCC ATGCAGTCCG GCGGCGCCGA AGCCGAGGCC 
GGCGCCGAGG GCGGCGAGCA GGAAGACGGC AGCTTCGACG CGGCCCCCGA GAGCGAGGAC 
GGCGAGGAAG GCGACAGCGC CGGCCTGTCG CTGTCCGCGC TGGAAGAAAA GCTGAAGCCC 
GAGATCCTGG CGCAGTTCGA GGAAATCGAG GAACTGTATT CCCGGCTGCA GAAGCTGCAG 
TCGAAGCGGC TGGAGACCCT GACCTCGGGC GCCGAGATGT CGGACAAGTC CGAGAAATCG 
TACGAGAAGC TGCGCGAGGA ACTGGTGGGC AAGGTGCAGC AGGTCCACCT GCACAACACC 
CGCATCGAGG TGCTGGTGCA GCACCTGAAG GAAATCTTCC AGCGGCTGAA CGGGCTGGAA 
GGGCGCATGC TGCGCCTGGC CGAGAGCACC AAGGTCTCGC GCGAGGACTT CCTGATCAAG 
TATCGCGGCA GCGAGCTGGA CCCGGGCTGG ATGGACATGG TGTCCGCCCT GCCGGGCAAG 
GCGTGGAAGA ATTTCGTCGC CAAGCATTCG GCGTCGGTGC TGGACCTGCG CGGCCAGGTC 
GCATCCCTGT CGCAGGAAAC CGGCCTGCCG GTCGGCGAAT TCCGCCGCGT CTACGCCACC 
GTGTCGCGCG GCGAGCGCGA TTCGGCCCGC GCGAAGAAGG AGATGATCGA GGCGAACCTG 
CGCCTGGTGA TCTCGATCGC CAAGAAATAT ACCAATCGCG GGTTGCAGTT CCTGGACCTG 
ATCCAGGAGG GCAATATCGG CCTGATGAAG GCGGTGGATA AGTTCGAATA TCGCCGGGGC 
TACAAGTTCT CGACCTATGC CACGTGGTGG ATCCGCCAGG CGATCACCCG GTCGATCGCC 
GACCAGGCCC GCACGATCCG CATCCCGGTC CATATGATCG AGACCATCAA CAAGCTGGTC 
CGCACGTCGC GCCAGATGCT GCATGAGATC GGACGCGAGC CCGCGCCCGA GGAACTGGCC 
GAAAAGCTGG GCATGCCGCT GGAGAAGGTG CGCAAGGTCC TGAAGATCGC CAAGGAACCG 
ATCTCGCTGG AAACGCCGAT CGGTGACGAG GAAGACAGCC ACCTGGGCGA TTTCATCGAG 
GACAAGACGG CGGTCATCCC GCTGGACGCC GCGATCCAGA CCAACCTGCG CGAAGCCACG 
ACGCGGGTCC TGTCCTCGCT GACCCCGCGT GAGGAACGCG TGCTGCGCAT GCGCTTCGGC 
ATCGGCATGA ACACCGACCA CACCCTGGAA GAGGTGGGCC AGCAGTTCAA CGTGACGCGC 
GAGCGCATCC GCCAGATCGA GGCGAAGGCG TTGCGCAAGC TGAAGCACCC GAGCCGCAGC 
CGCAAGCTGC GCTCGTTCCT GGACGACAAC TGA

Protein sequence

MATKTAAGSE ATAGDQDNDT TLLDTQSGAV KRLIARGKER GYITFDELNA VLPQDQMSSE 
QIEDVMAVLS EMGIQVVENE DNDDSEANRE EKAEEADTEG EEAGGAAGNV DTESLGRTDD 
PVRMYLREMG SVELLSREGE IAIAKRIEAG RDEMIGGLCE SPLTFRAIIS WHERLKAGEM 
LLRDIVDLEA MQSGGAEAEA GAEGGEQEDG SFDAAPESED GEEGDSAGLS LSALEEKLKP 
EILAQFEEIE ELYSRLQKLQ SKRLETLTSG AEMSDKSEKS YEKLREELVG KVQQVHLHNT 
RIEVLVQHLK EIFQRLNGLE GRMLRLAEST KVSREDFLIK YRGSELDPGW MDMVSALPGK 
AWKNFVAKHS ASVLDLRGQV ASLSQETGLP VGEFRRVYAT VSRGERDSAR AKKEMIEANL 
RLVISIAKKY TNRGLQFLDL IQEGNIGLMK AVDKFEYRRG YKFSTYATWW IRQAITRSIA 
DQARTIRIPV HMIETINKLV RTSRQMLHEI GREPAPEELA EKLGMPLEKV RKVLKIAKEP 
ISLETPIGDE EDSHLGDFIE DKTAVIPLDA AIQTNLREAT TRVLSSLTPR EERVLRMRFG 
IGMNTDHTLE EVGQQFNVTR ERIRQIEAKA LRKLKHPSRS RKLRSFLDDN