Gene Gdia_0115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0115
Symbol
ID	6973506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	130556
End bp	132457
Gene Length	1902 bp
Protein Length	633 aa
Translation table	11
GC content	69%
IMG OID	643389648
Product	cobalt chelatase, pCobT subunit
Protein accession	YP_002274530
Protein GI	209542301
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4547] Cobalamin biosynthesis protein CobT (nicotinate-mononucleotide:5, 6-dimethylbenzimidazole phosphoribosyltransferase)
TIGRFAM ID	[TIGR01651] cobaltochelatase, CobT subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.102217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0675463
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGACC GCAAGGACAC CACCCAGTCC GCACGATTGG CCGCCGCCGA GCGGGCCGAC 
GTCTTCAAGC GCGCGACCGT TGGCGCGCTG CGCGCGCTGG GCGGCCGGGC GACGGCCGAG 
GTCACGTTCC AGACCGGCCC GATTCCGCCT GCGGCGGCGG TCAGCGGCGA TCACGTCCGC 
CTGCCGCAGC CCGCCCTGCA ACTGGCCGAG GCCGATATCC GGCGCGTGCG CGGCGCGGCG 
GATGCCGTGG CGCTGCAACT GCGCCATCAT GACGTGACGA TCCACAACGC GACCCGGCCG 
GAGCAGGCCG ATGCCCGGCT GGCCTATGAC GCGCTGGAAC AGGCGCGGGT CGAAAGCTTC 
GGCGCGCGCC ACATGGCGGG AGTCGCCGCC AATCTGCGGA ATCAGGCCGA GCGGGACTAT 
CACGACAGGG GTTATGACCG GGCGCAGGCG CGCGACCAGA TTCCCGTGCA GGTTGCGCTG 
TCGCTGCTGG CGCGCGAACG CATGACGGGC GAGCCCGTGC CCGAGAGCAT GCGCGCGATG 
GCCGAACAGT GGCGTGCGCA TCTGGGCCCC TCGGCACTGC GCGCGCTGGA CGACATGGCC 
GCCCATCAGG ACGACCAGAT GGCGTTTTCG CGTGCCGCGA AGCGGCTGCT GGTCGCCTGC 
GAACTGATCG AGGGCGAGGC CGAGATCGAG GAGGACGAGG ACGGCGACGA CAGCGCCCCC 
TCGGACGAGA CCGAGGAAGA ACCGGGCGAA GCGCCCGAGA AGCCGCAGCC GCAGGACGAG 
GACGCCAGCG GCCAGCAGGA AGACGAGACC GGCCTGCAGC CCCAGTTGGC GCAAGGTGCG 
GGAGCCGGCG ACGACAACCC CGACGAGTCC GAACCCGGCG GTACAGCGGG GTCCGAGGAA 
GCGGGCGGCC CACGCGGCAC GGACGATCAG GAAGCGACCG ATCCGGCGTC CCTGTATCAT 
GCCTTCACCA CCGCGTTCGA CGAGGAAATC GCGGCCGAGG ATCTGTGCGA CGCCGACGAA 
CTGGCCCGCC TGCGCCAGCA GTTGGACCAC CAGTTGCTCA GCCTGCAGGG CGTGGTGTCG 
CGCCTGGCCA ACCGGCTGCA ACGACGCCTG CTGGCACAGC AGACGCGGGC GTGGGAGTTC 
GACCTGGAGG AAGGCATCCT GGATGCCGGC CGGCTGTCGC GGGTGGTGGT CAACCCGACG 
CTGTCGCTGT CCTACAAGCA CGAACGCGAC ACCGATTTCC GCGACACGGT CGTGACCCTG 
CTGATCGACA ATTCCGGATC GATGCGCGGC CGGCCGATTT CGGTGGCCGC GATGTGCGGC 
GACATCCTGG CCCGCACGCT GGAACGCTGC GCGGTGAAGG TCGAGGTCCT GGGCTTCACC 
ACCCGGGCCT GGAAGGGCGG GCAGAGCCGC GAGCGCTGGG TGGCGCAGGG CAAGCCGGCC 
AATCCGGGGC GGCTGAACGA TCTGCGGCAC ATCATCTACA AATCGGCGGA CATGCCGTGG 
CGCCGGGCGC GGAAGAATCT GGGCCTGATG CTGCGCGAGG GGCTGCTGAA GGAAAATATC 
GACGGCGAGG CCCTGCTGTG GGCCTGGCGG CGCCTGCAGG GCCGGCCGGA AAGCCGGAAG 
ATCCTGATGG TGATCTCGGA CGGCGCGCCG GTGGATGACA GCACGCTGTC GGTCAATGCC 
GGGTCGTATC TGGAAACGCA CCTGCGGCAG GTGATCGCCC AGATCGAAAA CCGCAGCGGC 
GTCGAACTGG TGGCCATCGG GATCGGCCAT GACGTGACGC GCTATTACCG CCGCGCGGTC 
ACGATCTCCG ACGCCGAGGA ACTGGGCGGC ACGATGATGC AGAAGCTCTC CGAACTTTTC 
GATGAAAAGG TCGCTGTCGC GGGTCGCCGC CGAATCGCCT GA

Protein sequence

MRDRKDTTQS ARLAAAERAD VFKRATVGAL RALGGRATAE VTFQTGPIPP AAAVSGDHVR 
LPQPALQLAE ADIRRVRGAA DAVALQLRHH DVTIHNATRP EQADARLAYD ALEQARVESF 
GARHMAGVAA NLRNQAERDY HDRGYDRAQA RDQIPVQVAL SLLARERMTG EPVPESMRAM 
AEQWRAHLGP SALRALDDMA AHQDDQMAFS RAAKRLLVAC ELIEGEAEIE EDEDGDDSAP 
SDETEEEPGE APEKPQPQDE DASGQQEDET GLQPQLAQGA GAGDDNPDES EPGGTAGSEE 
AGGPRGTDDQ EATDPASLYH AFTTAFDEEI AAEDLCDADE LARLRQQLDH QLLSLQGVVS 
RLANRLQRRL LAQQTRAWEF DLEEGILDAG RLSRVVVNPT LSLSYKHERD TDFRDTVVTL 
LIDNSGSMRG RPISVAAMCG DILARTLERC AVKVEVLGFT TRAWKGGQSR ERWVAQGKPA 
NPGRLNDLRH IIYKSADMPW RRARKNLGLM LREGLLKENI DGEALLWAWR RLQGRPESRK 
ILMVISDGAP VDDSTLSVNA GSYLETHLRQ VIAQIENRSG VELVAIGIGH DVTRYYRRAV 
TISDAEELGG TMMQKLSELF DEKVAVAGRR RIA