Gene Mvan_3500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3500
Symbol
ID	4649316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	3718552
End bp	3720093
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	67%
IMG OID	639806977
Product	hypothetical protein
Protein accession	YP_954301
Protein GI	120404472
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0583954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.298668
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAACT TCGACTGGCT CCTGCAGGGG TTCGCCGAGG CGGCAACTCC GACGAACCTG 
CTCTACGCCG TGATCGGCGT CCTGCTCGGC ACCGCCGTCG GCGTGCTGCC CGGCATCGGT 
CCCGCGATGA CCGTCGCGCT GCTGCTGCCG ATCACCTACA ACGTCAGCCC CAGCGCGGCA 
TTCATCATGT TCGCCGGCAT CTTCTACGGC GGCATGTACG GCGGCTCGAC CACCTCGATC 
CTGCTCAACA CTCCCGGCGA GTCGTCGTCG GTGATCACCG CCATCGAGGG CAACAAGATG 
GCGAAAGCGG GTCGCGCCGC CCAGGCGCTG GCCACGGCCG CGATCGGCTC CTTCGTGGCA 
GGTTCGATCG GCACCGCGCT GCTGGCGGCG TTCGCGCCCA TGATCTCGCG GTTCGCCGTG 
ACTCTCGGTG CTCCTTCGTA TCTGGCGATC ATGCTGTTCG CGCTCGTCGC GGTGACGGCG 
GTTCTGGGTT CGTCGAAGAT GCGCGGGCTG ATCTCGCTGC TGCTCGGTCT CGCGATCGGT 
GTGGTGGGTA TCGACTCGCT CACCGGTCAG CCCCGCGCCA CTTTCGGAAT CCCGCTGCTG 
TCTGACGGCA TCGACATCGT GGTGATCGCG GTCGCCGTGT TCGCAGTGGG GGAGGCGCTG 
TGGGTGGCCG CCCATCTGCG GCGCCGACCG GTCGACGTGA TCCCGGTCGG CCGCCCCTGG 
ATGAGCAAGC AGGACTGGGG CCGGTCGTGG AAACCGTGGT TGCGCGGCAC CGCGTTCGGC 
TTTCCGTTCG GTGCGCTGCC CGCCGGCGGC GCCGAGCTGC CGACGTTCCT GAGCTACATC 
ACCGAGAAGA AGCTGTCCAA GCATCCCGAG GAGTTCGGCA AGGGCGCCAT CGAAGGTGTG 
GCCGGACCGG AGGCGGCCAA CAACGCCTCC GCGGCAGGCA CCCTGGTGCC GATGCTGTCG 
CTGGGCCTAC CGACCAACGC GACGGCGGCG GTGATCCTGA CCGCGTTCGT CTCGTACGGC 
ATCCAGCCCG GACCCACGCT GTTCGACAAG GAGCCGCTGC TGATCTGGAC GTTGATCGCG 
AGCCTGTTCA TCGGCAACTT CCTGCTGCTG GTGCTGAACC TGCCCCTGGC GCCGTTGTGG 
GCGAGGTTGC TGCGCACGCC GCGGCCGTAC CTGTACGCCG GGATTCTGTT CTTCGCCACC 
CTGGGTGCGT TCGCGGTCAA CCTGCAGCCG CTGGATCTGG TGCTGCTGCT GATATTCGGC 
TTGATGGGTC TGATGATGCG CCGCTTCGGT CTCCCGGTGC TGCCATTGAT CATCGGTGTC 
ATCCTCGGCC CGCGCATCGA ACGTCAACTG CGGCAGAGCC TTCAGCTCGG CGGCGGGGAG 
TGGGGCAGCC TGTTCACCGA ACCCGTCGCG ATCATCACGT ATGTGCTGAT GATCCTGCTG 
CTGGCCGCGC CGTTGGTGCT GCGGTTGATG CACCGCAGCG AGGAGACGTT GCTTGTGGTC 
GAGGACGACC GGGACCAGAA AGAGAAGGCT GGGAAAGTGT GA

Protein sequence

MENFDWLLQG FAEAATPTNL LYAVIGVLLG TAVGVLPGIG PAMTVALLLP ITYNVSPSAA 
FIMFAGIFYG GMYGGSTTSI LLNTPGESSS VITAIEGNKM AKAGRAAQAL ATAAIGSFVA 
GSIGTALLAA FAPMISRFAV TLGAPSYLAI MLFALVAVTA VLGSSKMRGL ISLLLGLAIG 
VVGIDSLTGQ PRATFGIPLL SDGIDIVVIA VAVFAVGEAL WVAAHLRRRP VDVIPVGRPW 
MSKQDWGRSW KPWLRGTAFG FPFGALPAGG AELPTFLSYI TEKKLSKHPE EFGKGAIEGV 
AGPEAANNAS AAGTLVPMLS LGLPTNATAA VILTAFVSYG IQPGPTLFDK EPLLIWTLIA 
SLFIGNFLLL VLNLPLAPLW ARLLRTPRPY LYAGILFFAT LGAFAVNLQP LDLVLLLIFG 
LMGLMMRRFG LPVLPLIIGV ILGPRIERQL RQSLQLGGGE WGSLFTEPVA IITYVLMILL 
LAAPLVLRLM HRSEETLLVV EDDRDQKEKA GKV