Gene Saro_0333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0333
Symbol
ID	3915575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	355830
End bp	357164
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	68%
IMG OID	640443062
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_495615
Protein GI	87198358
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGC GCCACCAGAC TCCGGGATTG ATGATCGCCG CCCCCGCATC GGGCACAGGC 
AAGACCACGG TGATGCTGGG CCTGCTGCGC GCCCTGACCG AAGACGGGCT GGCGGTGCAG 
CCGTTCAAGA GCGGGCCGGA CTATATCGAC CCGGCGTTTC ACCGCGCGGC GAGTGGCAGG 
CCGTCGTTCA ATCTCGATAG CTGGGCGATG GAGGACGATC TGATCGCTGC CATTGCGGCG 
CAGGCCGGGG GCGCGGACAT GGTGCTGGCC GAAGGGTCGA TGGGGTTGTT CGATGGCGTG 
GCCAGCAAGG GTGCGTCGGG CAATGGTGCC AGCGCCGACA TGGCCCGCCG GATGGGCTGG 
CCGATCGTGC TGGTGCTGGA TGTGTCGGGG CAGGCGCAGT CCGCCGCCGC CACCGCGCTG 
GGGTTCAGCA GCCTTGATCC GGGGCTGCCA TTTGCCGGGG TGATCCTGAA CCGCGTGGCC 
AGTCCGCGTC ATGAACGGCT GGTGCGCAAG GGCATGGAGG CGGTGGGCAT TCCGGTGCTG 
GGCGCCCTGC CAAGGCGCGG CGACCTGACC CTGCCCGAAC GCCATCTGGG GCTGGTTCAG 
GCGGTGGAGC ATCCCGACCT TGATCGCGCG ATTGCCGAGT TTGCAGCGTT CCTGCGCGCC 
CATGTCGATC TTGACGTTAT TCGCCTTGCC GCTGGTGCCG CACCACAAGC CGACGGCGGC 
AACCTGCCTG CCCCTCCGGC CCAGCGGATC GCCATGGCGC GCGATGCGGC CTTTTCGTTC 
GTCTACCCGC ATCTGATCGA AGGCTGGCGG CGCGCCGGGG CGGAGATCCT GCCATTCTCG 
CCGCTGGCCG ATGAAGCGCC TGCCGCCCAT GCCGATCTGG TGTGGTTGCC CGGCGGCTAT 
CCCGAACTGC ACGCCGGGAC CATTGCGGCG GCTGCAACAT TCCTGTCCGG CCTGCGCTGC 
CATGCGCAAA CGCGGCCCGT GCACGGCGAA TGCGGCGGCT ATATGGTGCT GGGGCAGGGG 
TTGATCGACA AGAGCGGAGA ACGGCACCGG ATGGCCGGGC TGCTGGGGCT TGTCACCAGC 
CATGCCCAGC GCAAGATGCA CCTTGGCTAT CGCCATGCCG AACTGCTGGT GCCGGTATCG 
CGCCTTGCCG CCGGGACCAG GCTGCGCGGG CACGAGTTCC ACTATTCAAC CATTGCCGAA 
CAGAGCGACG CGCCGCTGGC GCTTGTGACC GATGCCGAAG GCGCGGCGGT GGCCGAAAGC 
GGATCGCATC GCGGCCATGT CACCGGCAGC TATTTCCACA TGATCGCGCC CGCTTCGTGC 
CGAGATGCCC AATGA

Protein sequence

MSARHQTPGL MIAAPASGTG KTTVMLGLLR ALTEDGLAVQ PFKSGPDYID PAFHRAASGR 
PSFNLDSWAM EDDLIAAIAA QAGGADMVLA EGSMGLFDGV ASKGASGNGA SADMARRMGW 
PIVLVLDVSG QAQSAAATAL GFSSLDPGLP FAGVILNRVA SPRHERLVRK GMEAVGIPVL 
GALPRRGDLT LPERHLGLVQ AVEHPDLDRA IAEFAAFLRA HVDLDVIRLA AGAAPQADGG 
NLPAPPAQRI AMARDAAFSF VYPHLIEGWR RAGAEILPFS PLADEAPAAH ADLVWLPGGY 
PELHAGTIAA AATFLSGLRC HAQTRPVHGE CGGYMVLGQG LIDKSGERHR MAGLLGLVTS 
HAQRKMHLGY RHAELLVPVS RLAAGTRLRG HEFHYSTIAE QSDAPLALVT DAEGAAVAES 
GSHRGHVTGS YFHMIAPASC RDAQ