Gene Gdia_3081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3081
Symbol
ID	6976515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3372260
End bp	3374176
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	71%
IMG OID	643392589
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_002277426
Protein GI	209545197
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0200059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATC GTCCCGTCGT CCTGCTGGTC GATGACGAAC CGGAAATCCT GGTGGCGCTG 
GGCGACCTGC TGGAGGATTC GTTCACCATC CTGTCCACCA CCTCGCCGGT CGAGGCGCTG 
GAGATCCTGG CCGGGCGCAG CGACGTCGAC GTCATCGTGT CCGACCAGCG CATGCCGGAA 
ATGGGCGGTG ACGTCATGCT GGCGCGGGCG CGCACCGTCT GCGACGCGCA GGCGATCCTG 
CTGACCGGCT ATGCCGATAT CGGCGCGGTG GCGGCGGCGC TGAACCAGGG GCGCATCTCG 
TTCTATTCCC ACAAGCCGTG GGACGGCGAC GCGCTGCGCG CCATGATCGT CCAGGCGGCG 
CATCGCCATC GGCTGGAAGG CGAACTGCAG ACCGAGCGGA TGCTGCTGCG GGGGTTGCAG 
CAGAATCTGC GCGCGGGCCT GGCGTTCAAG GACCCGCAGG GGCGCTTCAT CCGCATCAAC 
CGCAAGGCGG CCGCCTTCTA CGGGCGCGAC GAGGCCGCCT GCCTGGGACA GCGGGAGGAG 
GATGTGTGCG ACCCCGCCCA GCGTCCCGCC GTCCGTGAGG CCGAGGCCCG CCTGGCGGCC 
GAGGGCAAGG ACGAGGAGGT GATCGCCATT CCCGCGCCGG GAGGCGGGCT GTCCTGGCGG 
GAATTCACCC GGGTGCAACT GGACCGCAAT GCGCGCGGCG AGGCGTATTC CGTGCTGATC 
AACCGCGACA TCACCCGCCA GAGGGAGATG GAGGCCCGGC TGCGCCAGGC GGAGAAGATG 
CAGGCGCTGG GCACCATGGC CGGCGGGATC GCGCATGATT TCAACAATCT GCTGACGGCG 
GTGATGGGCT CGCTGGAACT GGCCACGGAC ATGGCCGACG GGCTGGACGA ACGGACGGCG 
CACCTGCTGG ACAACGCGAT GGCGGCGGCG CGGCGCGGGG CGGAACTGAC GCGGCGCCTG 
CTGAATTTCA GCCGGCCGCG CGACCTGAGC CTGCAGCCGG TGGACGTGAA CGCGCTGCTG 
CGCGGCATGC GCGATCTGCT GATGCAGGGC GTGACCTCGC GCCGGCGCGA CGGCAGCCAT 
GCGTCGTTCG ACATCCGCAT GGACAAACTG GCGCCGGACG GCGACCTGCC GCCGGCGCGC 
ACCGATGCCG GGCAACTGGA ACTGGCGCTT CTGAACCTGT GCATCAATGC CAGCGACGCC 
ATGCCCGACG GCGGGACCAT CACCCTGTCC ACGCGGGTGG CGCACCTGGA CGAACCGGCG 
GCCGAGGGCG AGCCCGCTTC GGGCGATTAC GTCGTGGTGT CGGTGGCCGA CCAGGGAACA 
GGCATGCCGC CCGAAACGGT GGCGCGGGTG TTCGAACCGT TCTTCACCAC CAAGGACGTG 
GGACGCGGGA CGGGGCTGGG GCTGTCGATG ATCTACGGCT TCGTGCGGCA TGTCGGCGGC 
GATGTCCGCG TGACCAGCGC GCCGGGGCAG GGCACGCGGG TGGATCTGTA TTTCCCGGTC 
CATCATCGCC AGGGCGGCGC ATCCGACCCC CGCGAGGCGG CGGAGCACGC GGCGGCCCCG 
CACGGGCTGC GGGTCCTGGT GGTCGATGAC GAGGACGCGG TGCGGGCCGT GACCGCCGGC 
TTCCTGCGCG GAATGGGCCA CCAGGCGATC GAGGCCCGGG GCGGCGAGGA CGCCCTGGCG 
CGGATCGCCG GCATGGCGCC CGATGTCCCC GACCTGGTGG TCATGGACGT GATGATGCCC 
CGGATGGACG GCGAGGAAGC GGCGCGCCGG ATTCGCGCGC ATTATCCGGG CAGCCGCATC 
CTGTTCCTGA CCGGCTATGC CGACGACACC ATCCTGCCCG ACGACGCCCT GGTGCTGCGC 
AAGCCCTTCA CCCAGGCGGA CCTGTCCCGC CATGTCAGCC GCGCGATGGC GGGCTGA

Protein sequence

MTDRPVVLLV DDEPEILVAL GDLLEDSFTI LSTTSPVEAL EILAGRSDVD VIVSDQRMPE 
MGGDVMLARA RTVCDAQAIL LTGYADIGAV AAALNQGRIS FYSHKPWDGD ALRAMIVQAA 
HRHRLEGELQ TERMLLRGLQ QNLRAGLAFK DPQGRFIRIN RKAAAFYGRD EAACLGQREE 
DVCDPAQRPA VREAEARLAA EGKDEEVIAI PAPGGGLSWR EFTRVQLDRN ARGEAYSVLI 
NRDITRQREM EARLRQAEKM QALGTMAGGI AHDFNNLLTA VMGSLELATD MADGLDERTA 
HLLDNAMAAA RRGAELTRRL LNFSRPRDLS LQPVDVNALL RGMRDLLMQG VTSRRRDGSH 
ASFDIRMDKL APDGDLPPAR TDAGQLELAL LNLCINASDA MPDGGTITLS TRVAHLDEPA 
AEGEPASGDY VVVSVADQGT GMPPETVARV FEPFFTTKDV GRGTGLGLSM IYGFVRHVGG 
DVRVTSAPGQ GTRVDLYFPV HHRQGGASDP REAAEHAAAP HGLRVLVVDD EDAVRAVTAG 
FLRGMGHQAI EARGGEDALA RIAGMAPDVP DLVVMDVMMP RMDGEEAARR IRAHYPGSRI 
LFLTGYADDT ILPDDALVLR KPFTQADLSR HVSRAMAG