Gene Mvan_3150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3150
Symbol
ID	4646382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	3347518
End bp	3348996
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	76%
IMG OID	639806627
Product	amidohydrolase
Protein accession	YP_953958
Protein GI	120404129
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0917954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0611897
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAGC GGCAGGTTCT GCACGGCGGC ACCGTGCTGA CCGGCCCGCA GTGGCGCCCG 
CGGCCCGCCG ACCTTCTCAT CGCCGGTGGC CGCATCGAGG CCGTCGCGGC GCCCGGCAGC 
CTCGCCGGCG TCGACGCCGC CACCCACGAC GTGACCGGCC GACTGGTGAT CCCGGGACTG 
ATCAACGCGC ACACCCATTC GCACACCGCG CCGGCGCGCG GCGCCGCACG TGCCTGGACG 
CTGGAGGACT CGCTGCTCAA CGGCGGCTGG ATGGCCGCGC CCCGCTCCGA GGAACTCACC 
GAGCTGGCCG CCCTGCTGAC CGCCACCGAG CTGATCGCCT CCGGGTGCAC CGGCGCCTTC 
GATCTCATCG CCCAGGCCGG CGGCCCCGAC CCGGCCGGCT GCCACGCCGC CGCCCGCGGC 
TACGCCCGCG CCGGGCTGCG CACCGTGCTG GCGCCGATGG TGGCCGACCG CACGCTGCAC 
GAGGCGGTGC CGGCGATCGG GGCATGCTGC GGGGCGCCGT CAACGGGCAA GCCGGGCCCG 
TCGACAGCCG ACGTCCTCGC GGCGTGCACG GCCTACGTCC GGAACTTCCC GGCGCTTCAG 
GGAGTCATGC CCGCGCTGGC CCCCACGATC CCGGGACACT GCACCCCGGA GCTGACGGTC 
GGGTTGGGTC GGCTGGCCGC CGAACACGGG CTGCGGGTGC ACACCCATCT CGCCGAATCC 
AAACCGCAGG CACTGGCCGG TGCGTCGCGG TTCGGGCATT CGATCACCCG CGAACTGGCC 
CGCCTCGGTG TGCTCGGCGA CCGGCTCACC GTGGCGCACG CCATCTGGGT CGACGACGAG 
GACATCAGGA TGCTGGCCGC CTCCGGCGCG GTCGCGGTCA CGGTGCCCGG CAGCAATCTG 
CGGCTGGGCT CCGGCATCGC CGACACCCGC GCGATGCTGG CAGCCGGCCT GCGGCTGGCG 
GTCGGCACCG ACGGCGCCAA CTCCGCCGAC GCGTTCGACG CGCTCGACGC GGTGCGGCTG 
ACCGCGCTGC TGTCGAGGGT CAGTGAGCGG CCGGCCCGCC AGTGGCTGAC CGTCGAGGAG 
ACCCTGGACG CCGCCACGGC CGGCGGTGCG GCGGCCTGCG GCTGGACCGA CACCGGTCGG 
CTGGCACCCG GCCGGCGCGC CGACTTCGCA CTGCTCGACC TCGGCGCCCG GGCGTTCCGG 
CCGCCCACCG ATCTGGCCAA CCAGCTGTTG ACCGCGGCGC GCGCCGCCGA CGTCACCGAT 
GTCGTCGTCG GGGGGCGGTT CGTCTACCGC GACCGCGGGT TCCCGCACCT GGACGTCGCG 
GCGGCACTGA ACCGGTTCGA CACGCTGGTC GAGGAGTTCC GCGCCCGGGT GGCGCCCGTG 
CGTGCCGACG CCGACCGCCA GACCGCCCTG GCCGCGACCG CGCTGGCCGG GCTGCGCCGG 
GCGCCGTCTC CGGTGCGACG GCTCATCGGC TGGCGATGA

Protein sequence

MTERQVLHGG TVLTGPQWRP RPADLLIAGG RIEAVAAPGS LAGVDAATHD VTGRLVIPGL 
INAHTHSHTA PARGAARAWT LEDSLLNGGW MAAPRSEELT ELAALLTATE LIASGCTGAF 
DLIAQAGGPD PAGCHAAARG YARAGLRTVL APMVADRTLH EAVPAIGACC GAPSTGKPGP 
STADVLAACT AYVRNFPALQ GVMPALAPTI PGHCTPELTV GLGRLAAEHG LRVHTHLAES 
KPQALAGASR FGHSITRELA RLGVLGDRLT VAHAIWVDDE DIRMLAASGA VAVTVPGSNL 
RLGSGIADTR AMLAAGLRLA VGTDGANSAD AFDALDAVRL TALLSRVSER PARQWLTVEE 
TLDAATAGGA AACGWTDTGR LAPGRRADFA LLDLGARAFR PPTDLANQLL TAARAADVTD 
VVVGGRFVYR DRGFPHLDVA AALNRFDTLV EEFRARVAPV RADADRQTAL AATALAGLRR 
APSPVRRLIG WR