Gene Mflv_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_3039
Symbol
ID	4974360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	3219766
End bp	3220827
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	71%
IMG OID	640457262
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001134304
Protein GI	145223626
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.892025
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGGGG CACTGCGCAA GGCGCTGTTC CTGGTCCCGC CCGAACGCAT CCACGGTCTC 
GTGTTCGCCG GGTTGCGTGC GGCCACGACC CCGGTCCCGC TGCGCCGGAG TCTGTCGCGG 
CGCCTCGCCC CCCACGATCC GGTGTTGGCC AGCACCGTGT TCGGGGTGCG TTTCCCGGGT 
CCGCTGGGGC TGGCCGCAGG ATTCGACAAG GACGGCCTCG GCGTGCACAC CTGGGGCGCA 
CTGGGTTTCG GGTATGCCGA ACTGGGAACC GTGACCGCGC AGGCACAGCC GGGCAATCCT 
CCCCCACGGA TGTTCCGGCT GCCCGCCGAC CGGGCCCTGC TCAATCGCAT GGGGTTCAAC 
AACCACGGGT CCGCGGCGCT GGCGCTGCAG CTGGCCCGCA GCTCCTCGGA CGTGCCGATC 
GGGGTGAACA TCGGCAAGAC GAAGGTCACC GAGCCGCAGG ACGCACCGGC CGACTACGCC 
GAGAGCGCCC GTCTGCTCGG GTCGCTGGCC GCCTATCTCG TGGTGAACGT GAGTTCGCCG 
AACACCCCGG GTCTGCGCGA TCTGCAGTCG GTGGAGTCGT TGCGTCCGAT CCTGTCGGCG 
GTCCTCGCCG AGACCTCGAC CCCGGTGCTG GTGAAGATCG CCCCCGACCT CGCCGACACC 
GACATCGACG ACATCGCCGA TCTGGCAGTC GAACTCGGTC TCGCCGGGAT CGTGGCCACC 
AACACCACGA TCTCCCGCGA CGGCCTGAAG ACTCCCGGTG CGGCCGACCT CGGCGCCGGG 
GGTATCTCCG GCCCGCCGGT GGCCCGCCGC GCGCTGGAGG TGTTGCGCCG CCTGTACGCC 
CGGGTGGGCG ACAAGCTGGT GCTCATCAGT GTCGGAGGCA TCGAGACGTC CGACGACGCG 
TGGGAACGGA TCACCGCGGG CGCCTCGCTG CTGCAGGGGT ACACCGGGTT CGTTTACGGC 
GGCGGCCTGT GGGCCAGGTC GATCAACGAC GGCGTCGCCG CCCGCCTCCG CGAGAACGGT 
TTCGGGACCC TCGCGGAGGC GGTCGGCTCG GCGGCGCGCT AG

Protein sequence

MYGALRKALF LVPPERIHGL VFAGLRAATT PVPLRRSLSR RLAPHDPVLA STVFGVRFPG 
PLGLAAGFDK DGLGVHTWGA LGFGYAELGT VTAQAQPGNP PPRMFRLPAD RALLNRMGFN 
NHGSAALALQ LARSSSDVPI GVNIGKTKVT EPQDAPADYA ESARLLGSLA AYLVVNVSSP 
NTPGLRDLQS VESLRPILSA VLAETSTPVL VKIAPDLADT DIDDIADLAV ELGLAGIVAT 
NTTISRDGLK TPGAADLGAG GISGPPVARR ALEVLRRLYA RVGDKLVLIS VGGIETSDDA 
WERITAGASL LQGYTGFVYG GGLWARSIND GVAARLRENG FGTLAEAVGS AAR