Gene Mvan_3050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3050
Symbol
ID	4643271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	3215103
End bp	3216590
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	69%
IMG OID	639806527
Product	hypothetical protein
Protein accession	YP_953858
Protein GI	120404029
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.184286
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTGTT CGCGGGAGGA CGTGTTGGGG GCCTTCGATG CCCTCGACGC GGTCGTGGAG 
TCGATCCTGG CGTTGGACTA CGACGCACTC AGTGCTGCCG AGCGGGTGCG TCTGGAGGCC 
CGCCTGGAAC GCAACCTGCG CCGTATCCCC ACTGTGGAAC ACGAGTTGCT CGCCTCGGTG 
ATCGCCGAGA CCGAGCCGGC CCGGTTGGGT GAGGGGTCGT GGAAGAAGGT GTTGACCACC 
GCGCTGCGGA TCTCCGGTGC CGAGGCAGGG CGGCGGCTGA AGCGGGCCAA AACCCTGGGC 
CCGCGGCGCG GACTGACCGG GACGCCGTTG CCACCGTTGT GGGAGTCCAC CGCCGCCGCC 
CAGGCCCAGG GCCTGCTGAG TGAGGAGCAT GTCGCGGTGA TCGCGGCGTT CCACAAGAGG 
CTGCCGGCCT GGGTCGATAT CGAGACCCGG GCCGAGGCCG ACCGCCAGCT GGCTCACGCG 
GGTTCCGGAC TGGATCCCGA AGGCCTCGAC GAGGCCGCCG GGGTGCTGCT GGCCATGATC 
AACCCCGACG GCGCCCAACC CTGCGACAAA GAGCGGGCCC GCAAACGGGG CATCCGGATC 
AGCAAGCAAC ACCCCGACGG CACCGCCACC ATCTCGGGCA CCCTCACCCC CGAAGCCCTG 
GCCATCTGGC AGGCGATCTT CGCCAAAGAA GCCGCCCCCG GCGCCAACAA CCCCGAGTCT 
GAACACACCG AGGACAGCAC ATCCGGCGGG GCGGCGGACG ACGCATCCGA CGCCCCGGGC 
GATCATGCCG GTGCCGCTTC GAGCGCGGCA TCAGGCGCAT CGGACGCTGC TGAGCATGAT 
CCACAGCCCG AACGGTGCGG CTCTGATACC CGTACCCAGG CTCAGCGCAA CCACGACGCC 
TTCCTGGCCG TCGGGCGCCG CCTCCTGGAA TCCGGAGAAC TCGGCACCCA CAACGGGTTA 
CCGGTGACGG TGATCGTCTC CACGACGCTG CAGGAGCTCG AAAAAGGCGC AGGGGTCGCG 
GTCACCGGCG GCGGATCGCT GTTGCCGATG CCGGATCTGA TCCGGCTTGC CGCCCGGGCC 
CACCACTACC TGTATGTCTA CGACCAACAC AGCGGCAAAT CCCTCTACCT GGGCCGGGCC 
AAACGGTTGG CCAACGCCGC GCAGCGGATC GTGCTGCACG CCCGCGACCG CGGGTGTACG 
CGGCCGGGCT GCACCGCACC CGGGTACTGG TGCCAGGCCC ACCACGCCAG CGCCGATTTC 
GTCGACGGCG GACTGACCAA CATCGACGAC CTGACGCTGG CATGCCCGTG CGATCACCGC 
ATGCTCGACA ACACCGGCTG GCGCACCCGC AAGAACGGCA AGAATCAGAC CGAATGGCTC 
CCGCCACCGG ACCTCGACAC AGGCCAACAC CGCGTCAACG GCCACCACCA CCCCGAAAGA 
TACCTACTCC CCGAAGACGA CCTCCCCGAA GACGACCAAG GACCCTGA

Protein sequence

MGCSREDVLG AFDALDAVVE SILALDYDAL SAAERVRLEA RLERNLRRIP TVEHELLASV 
IAETEPARLG EGSWKKVLTT ALRISGAEAG RRLKRAKTLG PRRGLTGTPL PPLWESTAAA 
QAQGLLSEEH VAVIAAFHKR LPAWVDIETR AEADRQLAHA GSGLDPEGLD EAAGVLLAMI 
NPDGAQPCDK ERARKRGIRI SKQHPDGTAT ISGTLTPEAL AIWQAIFAKE AAPGANNPES 
EHTEDSTSGG AADDASDAPG DHAGAASSAA SGASDAAEHD PQPERCGSDT RTQAQRNHDA 
FLAVGRRLLE SGELGTHNGL PVTVIVSTTL QELEKGAGVA VTGGGSLLPM PDLIRLAARA 
HHYLYVYDQH SGKSLYLGRA KRLANAAQRI VLHARDRGCT RPGCTAPGYW CQAHHASADF 
VDGGLTNIDD LTLACPCDHR MLDNTGWRTR KNGKNQTEWL PPPDLDTGQH RVNGHHHPER 
YLLPEDDLPE DDQGP