Gene Mvan_0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0149
Symbol
ID	4647043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	161503
End bp	162525
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	67%
IMG OID	639803660
Product	RNA polymerase factor sigma-70
Protein accession	YP_951006
Protein GI	120401177
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02960] RNA polymerase sigma-70 factor, TIGR02960 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACAGC CGGTGCGTAA GCTGCATTTT GTGACCGTCA CGGCTCTTGA CGACAGCAGC 
GCCGAGGACG CCTTTCTCGC GGATGCACAG AGGTATCGGC GGGAGTTGCT GGCGCACTGC 
TACCGGATGA CCGGTTCGCT GCACGATGCG GAAGATCTGG TCCAGGAAAC CTATCTACGC 
GCCTGGAAGT CCTTCAAGGG GTTTCAGGGC AAATCCTCGG TGCGGACCTG GCTGTACCGC 
ATCGCGACGA ACACCTGCCT GACGGCGCTG GACGGCAACA AGCGCCGGGC GCTGCCGAGC 
GGGCTGGGCC AGCCGGCGTC CGACCCTGCC GGTGAGCTGT TCGTGCGTCC GGAGGTGACC 
TGGCTGGAGC CGCTGCCCGA CGCCCCGCGC GAGGACCCGT CGGATCCGTC GGTGATCGCC 
GAGTCCCGCG AGTCGGTCCG GCTGGCGTTC ATCGCCGCCC TGCAGCATCT CCCGCCGCGG 
CAGCGCGCGG TGCTGGTGCT GCGCGAAGTG CTGCAGTGGA AGGCCGCGGA GGTCGGTGAG 
GCGGTCGGCA CCTCGACCGC CGCGGTCAAC AGCCTGCTGC AGCGGGCCCG CGCCCAGCTC 
GACGAGATCT CACCCAGCCG CGATGACGAG CCGGTCCCAC CGGAGTCGCC CGAGGCTGCG 
GAGCTGCTGG ACAAGTACAT CGCCGCGTTC GAGGACTACG ACATGGACCG GCTGGTCGAG 
CTGTTCACCG ACGACGCGGT GTGGGAGATG CCACCGTTCG ACGGCTGGTA CCAGGGTCCC 
GCCAATATCG TCACGCTGTC GAAGGTGCAG TGCCCGGCAG AGAAAGCCGG CGACATGCGC 
TTCCTCAGAA CCACCGCCAA CGGGCAACCT GTGGCCGCGC TCTACATGCG CAACCCGGAA 
ACCGGTGTGC ACGAGGCATT TCAGCTGCAC GTGCTCGACG CGGGCAAGGC CGGAATCACA 
CACGTGGTGG CGTTCAAGGA GAACGACCTG TTCGCCAGGT TCGGGCTGCC CGACACTCTC 
TAA

Protein sequence

MSQPVRKLHF VTVTALDDSS AEDAFLADAQ RYRRELLAHC YRMTGSLHDA EDLVQETYLR 
AWKSFKGFQG KSSVRTWLYR IATNTCLTAL DGNKRRALPS GLGQPASDPA GELFVRPEVT 
WLEPLPDAPR EDPSDPSVIA ESRESVRLAF IAALQHLPPR QRAVLVLREV LQWKAAEVGE 
AVGTSTAAVN SLLQRARAQL DEISPSRDDE PVPPESPEAA ELLDKYIAAF EDYDMDRLVE 
LFTDDAVWEM PPFDGWYQGP ANIVTLSKVQ CPAEKAGDMR FLRTTANGQP VAALYMRNPE 
TGVHEAFQLH VLDAGKAGIT HVVAFKENDL FARFGLPDTL