Gene Gdia_2235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2235
Symbol
ID	6975664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2479041
End bp	2480453
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	75%
IMG OID	643391762
Product	uroporphyrin-III C-methyltransferase
Protein accession	YP_002276605
Protein GI	209544376
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0007] Uroporphyrinogen-III methylase [COG1648] Siroheme synthase (precorrin-2 oxidase/ferrochelatase domain)
TIGRFAM ID	[TIGR01469] uroporphyrin-III C-methyltransferase [TIGR01470] siroheme synthase, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATG CGACCGACCC CGGCTGGTTC CCGCTGGCGC TGCGGCTGCG CGGCGCGCGG 
GTGGTGGTGG TGGGCGGCGG CGGGATCGCG CTGAACAAGG TCCGGCTGCT GCTGGCCCAC 
GCCGCGCGGA TCGACATCCT GGCCCCCCGG CTGGAGGACA CGCTGGCCGC CTGGCAGGCC 
GAAGGGCGGA TCACCCACAT CGCGGGCGAG GCGACGCCCG ACCGGGTGCG TGCGCTGCTG 
CCCGGCAGCC GCCTGGTCTA TGCCGCGACC GACGACCGGG CGGTGAACCG CGCCGTCGCG 
GCGCAGGCCG ATGCGCTGAA TATCCCGGTC TGCGCGGTGG ACGACCCGGA GCCGTCTTCC 
TTCATCACGC CCGCGCAGAT CCATCGCGGG CCGGTGCGGA TCGCGATTTC CACCGGCGGC 
GCGGCCCCGG TGCTGGCCCG GCGCCTGCGC GAGCGGATCG AGGCCGTGAT GCCGGCCGGG 
CTCGACGCGC TGGCGCGCTT CCTGCAGGCC GAGCGCGCTC ATGTCGTGGC TGCCTGCCCC 
GATATCGGCC GCCGCCGCCG GGTATGGGAG GATTTCCTGG ACGGCCCAGG CGGCGAGGCG 
GCGCAGCGCG GCGAACACGC GGCCGCGCGA CAGGTACTGG ACCACCTGCT GGCCGGCGCG 
CAGACCGGGG GCGAGGTCTG GCTGGTCGGC GCCGGGCCGG GGGACCCGGA CCTGCTGACC 
CTGCGGGCGC TGCACCTGAT GCAGAACGCG GATTCGGTGC TGTACGACCA GTTGCTGCCG 
CCCGCGTTGA TGGACCGGGT GCGCCGCGAT GCCGAGCGGG TGTTCGTGGG CAAGCAGCGC 
GACCGCCACA CCATGCCGCA GGACGACATC AATGCCGAAC TGATCCGCCG CGCGCGGGCG 
GGCGAGCGGG TGCTGCGCCT GAAGGGCGGG GACCCGTTCA TCTTCGGTCG CGGCGGCGAG 
GAGATCGAGG CCCTGATGGC GGCGGGAATT CCGTTCCAGG TCGTGCCGGG CATCACGGCG 
GCCAGCGGCT GCGCCGCCTA TGCCGGCATT CCGCTGACCC ACCGGGACTG CGCCCAGTCC 
TGCCTGTTCG TCACCGGTCA CGCCCGCCGC GACGGCACGC TGGACCTGCC GTGGGACAGC 
ATGGCCCGGC CGGGGCAGAC CATCGCGATC TATATGGGCG TCACCGCGCT GCCGGACCTG 
TGCACCATGC TGGTGCGCCA CGGCCTGCCG CCCGACTGGC CCGCCGCCGT GGTGGAGCGC 
GGCACCCGGC CCGACCAGCG CGTGCTGACG GGAACCCTGG CCGACCTGCC GGCGCTGGCG 
CGCGCCCATG CCGTGGGCAG CCCGGCGCTG GTGCTGGTGG GCCAGGTGGT GCGGCATCGC 
GTCGTCACGC CGCCGCCCCT GTCCGGTACG TGA

Protein sequence

MSDATDPGWF PLALRLRGAR VVVVGGGGIA LNKVRLLLAH AARIDILAPR LEDTLAAWQA 
EGRITHIAGE ATPDRVRALL PGSRLVYAAT DDRAVNRAVA AQADALNIPV CAVDDPEPSS 
FITPAQIHRG PVRIAISTGG AAPVLARRLR ERIEAVMPAG LDALARFLQA ERAHVVAACP 
DIGRRRRVWE DFLDGPGGEA AQRGEHAAAR QVLDHLLAGA QTGGEVWLVG AGPGDPDLLT 
LRALHLMQNA DSVLYDQLLP PALMDRVRRD AERVFVGKQR DRHTMPQDDI NAELIRRARA 
GERVLRLKGG DPFIFGRGGE EIEALMAAGI PFQVVPGITA ASGCAAYAGI PLTHRDCAQS 
CLFVTGHARR DGTLDLPWDS MARPGQTIAI YMGVTALPDL CTMLVRHGLP PDWPAAVVER 
GTRPDQRVLT GTLADLPALA RAHAVGSPAL VLVGQVVRHR VVTPPPLSGT