Gene Mvan_5366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5366
Symbol
ID	4647082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5742278
End bp	5743468
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	75%
IMG OID	639808841
Product	hypothetical protein
Protein accession	YP_956143
Protein GI	120406314
COG category	[A] RNA processing and modification
COG ID	[COG5178] U5 snRNP spliceosome subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000423531
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCGATC CGACCCGTGG CGCGCGCCTT CGGCGCGGCG GCCGCAGGCC GGGTTGGATC 
CTGATGACGG TGTTGCTGGT GCTCGCGATC GCAGCCAGTT CAGCGCTGGT TTTCACCAAC 
CGCGTCGAAC TGCTCAAGCT GGCCGTGATT CTCGCGTTGT GGGCGGCCGT GGTCGCCGCG 
TTCGTCTCGG TCATCTACCG CAGGCAGAGC GACGCCGACC AGGCCAAGGT GCGCGACCTC 
AAGCTCGTGT ACGACCTGCA GCTCGATCGC GAGATCTCCG CGCGACGGGA GTACGAGCTC 
GCCGTCGAAA CGCATCTGCG CCGCGAGTTG GCCTCGGAGT TGCGGGCGCA GTCCGCCGAC 
GAGGTGGCGG CGCTGCGCGC CGAACTGGCC GCGTTGCGTG CGAATCTGGA ATTCCTCTTC 
GACACCGATC TCTCGCACCG GCCCGCCATC GAGACCGAGC GCACCGCCGG GCGCGTCAGC 
AGCAGCCGGA TCGACACCCA GGAAGACTTC AGGGCCGCCG AGGAGCCGTA CGCACCCAAG 
ACCGATGAGA GTCCCATCAT CGACGTGCCG GCCGAGCCGC ACCCTCCGGA GGGCGAGTGG 
GCACCGCGCG GCGAAGCCGG TGGCGCGCAT CGCCGTTCGG CCGAGCAGCC GCAGTGGGCC 
CCGCCGCCCG CGCCCGCGCC CCCGCCCCCG CCCCCGCCCC CGCCCCCGCC GCCTCCACCG 
CCCCCGGCGC AGCAGCCGCC ACCTCCGCCG CAGCCGACCC CGCCCCCGGC GCAGCAGCCG 
AGCCCCGAGC CGCAGTTCCC CTGGCTGCCG CCCGCTCCGC CGCCACGCCC GCAACCCCGC 
ACCCCCGAAC CGGCACCCAC TGCTTCCGGG TGGAAGCCGG TGCCCGCTGA GGGGCAGTGG 
ATTCCGGCGG GAGAGCCCGG CAGCCACTGG GCCGCCGCGC ACGCCAACGG CGACCAGGGC 
GAGTATGTGG GCCGCCGCCG GGCGCCGGAC CAGGTCGAGC CCGAGCCACC CCGCGGCAAG 
CATTCCGCGG CGGGTGAGGA GCCGACGGAG GCACCTGCTG CACCGGAGGC GCCGGCCGAG 
CCCGACGCCG ACGGCGGCGC GCACACCGGT GGCCAGTCGG TGGCCGAGCT GCTGGCTCGG 
CTGCAGGCGG CCCCGTCGGG CGGTGGCAGG CGTAGGCGCC GCGAGGACTG A

Protein sequence

MTDPTRGARL RRGGRRPGWI LMTVLLVLAI AASSALVFTN RVELLKLAVI LALWAAVVAA 
FVSVIYRRQS DADQAKVRDL KLVYDLQLDR EISARREYEL AVETHLRREL ASELRAQSAD 
EVAALRAELA ALRANLEFLF DTDLSHRPAI ETERTAGRVS SSRIDTQEDF RAAEEPYAPK 
TDESPIIDVP AEPHPPEGEW APRGEAGGAH RRSAEQPQWA PPPAPAPPPP PPPPPPPPPP 
PPAQQPPPPP QPTPPPAQQP SPEPQFPWLP PAPPPRPQPR TPEPAPTASG WKPVPAEGQW 
IPAGEPGSHW AAAHANGDQG EYVGRRRAPD QVEPEPPRGK HSAAGEEPTE APAAPEAPAE 
PDADGGAHTG GQSVAELLAR LQAAPSGGGR RRRRED