Gene Mvan_5379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5379
Symbol
ID	4647095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5756160
End bp	5757230
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	69%
IMG OID	639808854
Product	hypothetical protein
Protein accession	YP_956156
Protein GI	120406327
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00392242
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTCGT CGTCGAAGTC CGGTTTCACG GTCGGCCGTG CGGTGGACTG GAAGCTGGCC 
GCCACGTTGG GCGGCAAACT GGCGCGTCCG GAGCCGCCGG CCACCGACTA CACGCGCAAG 
CAGGCGTTCG AGCAGCTCGC CGAGGCGGCC CGGGCCTCCG AGCTGCCGGT GCGGGAGGTG 
ACCGGGCTGA TCGAGGGCGG TGAGATCCCC GAGGCGCGAA TCGTCAACCG GCCCGAGTGG 
ATCCACGCCG CCGCGCAGTC GATGCGGGCG ATGACGGGCG GCGGGCACGC AGACGACGTC 
AAGCCGCGTG CCGTCACCGG TCGTATCGCC GGTGCGCAGA CCGGGGCCGT GCTTGCGTTC 
GTCTCATCGG GGATCCTCGG CCAGTACGAC CCGTTCGCCG TGGGGGGCGG AGAGCTGCTC 
CTGGTGTACC CGAACGTGAT CGCCGTCGAG CGGCAGCTTC GGGTGGCGCC CAAGGACTTC 
CGGATGTGGG TGTGTCTGCA CGAGGTCACC CACCGTGTGC AGTTCCGGGC CAACCCCTGG 
CTGGCCGACC ACATGTCGAA GGCGCTCGCG GTGCTGACCG AGGACGCCGG GGAAGACCTG 
CCCCAGGTGG TCGGCCGGCT CGTCGACTAC GTCCGTGACC GCGAGGTGGT GGTGAAAAAC 
TCTGAGCCGG CGATGAATTC GACCGGTGTG CTGGGGCTGT TGCGCGCCGT GCAATCCGAG 
CCGCAGCGTG AGGCGCTCGA CCGGCTGCTG GTGCTCGGCA CCCTGCTCGA AGGTCACGCC 
GAGCACGTGA TGGACGCCGT CGGGCCTGCG GTGGTGCCGT CGGTGGCCTC CATCAGGCAC 
CGGTTCGATC AGCGCAGGCA ACGCAGACAG CCGCCGCTGC AACGGCTGTT GCGTGCGCTG 
CTCGGCGTCG ACGCGAAGAT GAGCCAGTAC ACCAGGGGCA AGGCCTTCGT CGACCACGTG 
GTGGCCGAGG TCGGCATGCA GCGTTTCAAC GCGATCTGGA CCGACGCCGA GACCCTGCCG 
AAGCCCGCGG AAATCGACGA ACCGCAGCGA TGGATCGACC GGGTGCTGTA G

Protein sequence

MSSSSKSGFT VGRAVDWKLA ATLGGKLARP EPPATDYTRK QAFEQLAEAA RASELPVREV 
TGLIEGGEIP EARIVNRPEW IHAAAQSMRA MTGGGHADDV KPRAVTGRIA GAQTGAVLAF 
VSSGILGQYD PFAVGGGELL LVYPNVIAVE RQLRVAPKDF RMWVCLHEVT HRVQFRANPW 
LADHMSKALA VLTEDAGEDL PQVVGRLVDY VRDREVVVKN SEPAMNSTGV LGLLRAVQSE 
PQREALDRLL VLGTLLEGHA EHVMDAVGPA VVPSVASIRH RFDQRRQRRQ PPLQRLLRAL 
LGVDAKMSQY TRGKAFVDHV VAEVGMQRFN AIWTDAETLP KPAEIDEPQR WIDRVL