Gene Namu_4274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4274
Symbol
ID	8449900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4753908
End bp	4754975
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	74%
IMG OID	645043322
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_003203551
Protein GI	258654395
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.637191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCG GCGGCGTGGC CTACCGGCGG GTGGCCCGGC CGGTGCTGTT CCGGATGGGC 
AAGGGTGACC CGGAGGTGGT CCACCACCGG ACCCTGTCCG CGCTGGCCCG GGTGTCCCGG 
TCGGCCCCGG CGCTGCGCCT GCTGGGCGGC CTGCGCCGTC GACACCCCAG CCCGCGCACC 
GTCTTCGGGG TGGACTTCCC GTCCGCCGTC GGGTTGGCGG CGGGCATGGA CAAGGACGGC 
GTGGCCCTGA AGGCCTGGCC GGCCCTGGGT TTCGGTCACG TCGAGGTCGG CACCGTCACC 
GCGCACCCGC AGCCGGGCAA CCCGCGGCCG CGGCTGTTCC GGCTGCCCGC CTCCGGCGCG 
ATCATCAACC GGATGGGGTT CAACAACTCC GGGGCGCAGG CGCTGGCCGC CCGGCTGGCC 
ACCACCGGCC GGATCGGCGT GCCGCTGGGC ATCTCGCTGG GCAAGTCCAA GATCACTCCG 
GTGGACGAAG CCGTCGGCGA CTACCTGACC TCGCTGCGCG CCGTCTACCC GTTCGCGGAC 
TACATCGCGG TCAACGTCTC CAGCCCGAAC ACCCCGGGCC TGCGCACCCT GCAGGATCGG 
GCCCCGCTGG ACGAGCTGCT GGCCGCGCTG ACCACCGAGG CGGGCAGCCT GGCCTGGTCG 
CTGGGGCAGC GGCGCACGCC GGTCCCGGTG CTGGTCAAGA TCGCCCCCGA CCTGACCGAT 
CAGGCCATCG CCGACCTGCT GGAGGTCTGC GTGGACCGCG GCATCGCCGG GCTGATCGCC 
ACCAACACCA CCTTGACCCG GCCGGGCCTG GCTGCCGGCG ACGCGGCCAC CGCCGCGGAA 
GCCGGTGGGC TGTCCGGGCG GCCGCTGGCC CCCCGATCGC TGGAAGTGGT CCGCTTCGTC 
ACCGCCCACT GCGACCTGCC GGTGATCGGC GTCGGCGGCA TCGGCACGGT CGACGACGGG 
CTGCGCATGC TCGACGCCGG GGCCAGCCTG CTGCAGCTCT ACACCGGGTT CATCTTCGGC 
GGGCCGCCGC TGGTGACCTC GTTGAACAAG GCCATCGCCG CCCGCTGA

Protein sequence

MSVGGVAYRR VARPVLFRMG KGDPEVVHHR TLSALARVSR SAPALRLLGG LRRRHPSPRT 
VFGVDFPSAV GLAAGMDKDG VALKAWPALG FGHVEVGTVT AHPQPGNPRP RLFRLPASGA 
IINRMGFNNS GAQALAARLA TTGRIGVPLG ISLGKSKITP VDEAVGDYLT SLRAVYPFAD 
YIAVNVSSPN TPGLRTLQDR APLDELLAAL TTEAGSLAWS LGQRRTPVPV LVKIAPDLTD 
QAIADLLEVC VDRGIAGLIA TNTTLTRPGL AAGDAATAAE AGGLSGRPLA PRSLEVVRFV 
TAHCDLPVIG VGGIGTVDDG LRMLDAGASL LQLYTGFIFG GPPLVTSLNK AIAAR