Gene Mvan_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0035
Symbol
ID	4644816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	43303
End bp	44505
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	59%
IMG OID	639803546
Product	hypothetical protein
Protein accession	YP_950892
Protein GI	120401063
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.89444
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGAAT CTGTTCGACT GGGCGATCTC ATCTCTGTCA AGCATGGCTA TGCCTTCCCC 
GGCGAGGGGT TCACAGAAGA CCCGACGTAT CCAATCTTGG TCACACCTGG GAATTTCGCG 
ATCGAAGGCG GATTCAAGGA ATCGAAACCA AAGACGTTCA ACGGCGACTA CCCACCAGGG 
TTCGAACTGG CGCCGGGCGA CTTAGTGGTT TCAATGACCG ACCTTAGCCG CGACGGTGCG 
ACCCTCGGTA TGCCGGCGCT GATCCCGGCT GGCCCGACCT ATTTGCACAA TCAGCGGATC 
GGACTTATCG AGGCGATCGA TCGATCGAAG ATTGATCGGC TTTTCCTCAA CTATTACCTG 
CGCACGGCCG CTTATAGATC CCACATTCTA GGCACTGCTT CGGGATCGAC AGTTCGTCAT 
ACGAGCCCTA GCCGTATCGA GGATTTTGTT GCGCTTCTGC CTGGGCTTCT GGAGCAGCAA 
GCGATAGGAG CGATTTTGGG ATCGCTCGAC GACAAAATTG GCGTGAATCG CAGACTGGCG 
AATGTCGGTC GGCTCCTTCA GTCGGAACTC TGGCATCGTG CTGCAACGGG GAGCCGTCAG 
GTGTCCCTAG GGTCGTTGGT GCGGCCTCAT CTTGGCGGTA CACCATCACG TTCCGATAGC 
AACTTATGGG CAGGTGACGT TCCGTGGGCG TCTGTTCGCG ACATGTCTGC TGCGGACGGT 
GGCGTTCTCT TAGCTACTGC CGAGACGATC AGCTCGGCCG TTTCTCAGTC AGTCGGTCGC 
CTCGCTGCCC TACCAGAGCG ATCAGTTGCC CTGACTGCAA GGGGCACGGT TGGCAAAGTC 
GTGACTCTGG GAGTAGCAAG CGCGATCAAC CAGTCGGCAT ACGGCTTTAT TCCGCCGGCA 
GGACGGGGGG TGGCGTTACG GTGCGCACTG GAGTCGATTT CCGATGAGCT GAAGGCGCGT 
GCACACGGCT CGGTATTCTC AACAATCACG ATGTCGACGC TCGAGAGCGT ACGTGTCCCG 
GCGATCAACG AGACAGACTG GGACGGGGTA TGCGAGTCAC TTGAGTTGAT CGAAGATCGT 
AGACTGTCAG CCCTCCGGGA GACTCGGGTG CTCGCCCGCA CGCGAGACGA ACTCCTCCCA 
CTGCTCATGT CCGGCAGAAT CCGCGTCAAG GATGCCGAAG CCCGCGTGTC GGAGGTGGTG 
TGA

Protein sequence

MRESVRLGDL ISVKHGYAFP GEGFTEDPTY PILVTPGNFA IEGGFKESKP KTFNGDYPPG 
FELAPGDLVV SMTDLSRDGA TLGMPALIPA GPTYLHNQRI GLIEAIDRSK IDRLFLNYYL 
RTAAYRSHIL GTASGSTVRH TSPSRIEDFV ALLPGLLEQQ AIGAILGSLD DKIGVNRRLA 
NVGRLLQSEL WHRAATGSRQ VSLGSLVRPH LGGTPSRSDS NLWAGDVPWA SVRDMSAADG 
GVLLATAETI SSAVSQSVGR LAALPERSVA LTARGTVGKV VTLGVASAIN QSAYGFIPPA 
GRGVALRCAL ESISDELKAR AHGSVFSTIT MSTLESVRVP AINETDWDGV CESLELIEDR 
RLSALRETRV LARTRDELLP LLMSGRIRVK DAEARVSEVV