Gene Mvan_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1940
Symbol
ID	4648177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	2075004
End bp	2076986
Gene Length	1983 bp
Protein Length	660 aa
Translation table	11
GC content	68%
IMG OID	639805427
Product	hypothetical protein
Protein accession	YP_952766
Protein GI	120402937
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGCGTT ACCGTACGGG CGGGGGTCAG CACGGAAGGA CGCCGCTCTT GACGACGACG 
CCGCAGCATC CGGTCAGCCC GTTGTCCCGC CACGGGCGGT TCGTCGGCCG CGTCGGAGGG 
CTCGCGGTGG CGCTAGGGAT CGGCATCGCG ATCGCGAACA GCCCCGCCGT CGCGGCTGCC 
GACGACGACA CCACGAGCTC GGAGGCATCG TCCGCGTCAA CCGCGGACAG CGACACGATC 
TCGAACACCC CGAACAACAC CGACAGCGAC AGCGACAGCG ACAGCGAAGA GTCGGGCGAC 
GCCGGGGAGC CGGACCAGGC CGACGAGGAC GATCCGGCAC CTGACGTCGA AGACGAGGAG 
CGGCGGACCC GGGTCACCGT CGACGTCCCC TCCCCCGAGT CCGAGGCCGA ACCCGACTCC 
AAGTCCGAGT CCGAGCCCGA GACCGAGACC GAACCCGAGG CCGACGCCGA ATCCGTCGAT 
CGCGACGACT CCGCCGATGA CCCCGTCAGC CCCGAGCCGG CGGCGGTCTG GGCACTTGCC 
GGATCCGCAC GCCGCGAGAC CGCTGTCGAG TCCCCTTCGA TGACGCAGGA CATCCAGGCG 
GCGGCCACGG CCAGCCCGCT GGGCACCGAA CAACAACTCG AGGCCGAGCA GATCGCCGCC 
GAAACGGTGA AGACCTGGCC GGTGCGGCTG ATGAAGTTCG TGTTGAGCGT GGGCTGGCTG 
GCGACAGCGC ATCGCGAGTA CAGCGAGATC AACGGCCCGG ACTGGGACAA CCTCTGGCAG 
CTGCACCGGG CCGTCGACGA GTACGCGATG GGCACCGCCT TCCAGCAGCA GCTGCTCAAC 
CCGATGACGC CGACCGTGGT CACCCAGGTC GCGCCGCCGC ACAGCTGGTA CGGCCGGGAC 
GTCGAGGGCT CCCGCATCCT CTACGACAAC CCCGACACGA TCTACCGCTT CATGGGCGTG 
AACATGACCT CCACCTACGT GATCAAGGGC CAGTTCGTCG GCGTGCACCC GGCGGACACC 
AGCTTCAGCG TGCTCACCGG ACTGTCCGGC GTCACCGCGG ACTACCTCAG CGGCCGCGAC 
ATCGAGATCG CACCGGACGG CTCGTTCACG ATCACCGTCA GCGGCGCGCC CGCCGCGCCG 
GGCCAGGCCA ACCACCTGCA GCTGACCGCC GACACCACAC TGATCGCGGT GCGCAACACC 
TTGTCGGACT GGACCACGCA GGACCCGATG AGCCTGACCA TCGAACGGTT GTCGGGTCCG 
CGGAACAGTC TGTTCAGCCA GCTCGGCGGC TTCGCGATCC CCGGGCTCGG ACCGATGGTG 
ACGAAGAGCC CGCTGCTGAC GACGCTGGTG TCGTTGATCC CGCCGATGAA GGAGCCGCCG 
CGGATTCTGC GGGGCGCGTT CGCGGCGGTC ATCATGGGGC TCGGCCTGGG GATGGAGTCC 
AAGTACATCA AGGTCGCCAC CACCGATCCG GCGACCGGTG ACCGCGTCGC GCCCAACCAC 
CTACCCCACC CGTCGCGCAA CGCCGAGTTC CTGGCCACCC AGCTGCAGAG CGCCGGATAC 
TTCCAGCTGT GCGACGATCA GGCCCTGGTC GTCACCATCG TGCCCGGCAA TGCGCGCTAC 
TTCGTCGTCC CGGTCACCAA CCTGTGGACC GTCACGGGAA ACTATTGGGA CGAACAGACC 
AGCCTGAACA ACGCGCAGGC CGTCGCGAAT CCGGACGGCA GCTACACGTT CGTCATCTCA 
CCCACCGACA CCGGTGTCCA CAACTGGGTG TCGACCGGCG GACTGAACAA GGGCACGGTG 
TCGATCCGCT TTCAGGACCT CGACCTGGCG TCGTCGAAGA CTCCGACGGT GACCTCCGCG 
GTGGTGCCGG TGTCGGACCT GGCGGCGGTC CTTCCGCCGA CGACGGCATA CGTGACCGCC 
GCCGAACGCC AGAGCCAACT CAGCGTCCGT AGGGCGGGCT TCGACCGTCG CTTCGCGGAT 
TGA

Protein sequence

MRRYRTGGGQ HGRTPLLTTT PQHPVSPLSR HGRFVGRVGG LAVALGIGIA IANSPAVAAA 
DDDTTSSEAS SASTADSDTI SNTPNNTDSD SDSDSEESGD AGEPDQADED DPAPDVEDEE 
RRTRVTVDVP SPESEAEPDS KSESEPETET EPEADAESVD RDDSADDPVS PEPAAVWALA 
GSARRETAVE SPSMTQDIQA AATASPLGTE QQLEAEQIAA ETVKTWPVRL MKFVLSVGWL 
ATAHREYSEI NGPDWDNLWQ LHRAVDEYAM GTAFQQQLLN PMTPTVVTQV APPHSWYGRD 
VEGSRILYDN PDTIYRFMGV NMTSTYVIKG QFVGVHPADT SFSVLTGLSG VTADYLSGRD 
IEIAPDGSFT ITVSGAPAAP GQANHLQLTA DTTLIAVRNT LSDWTTQDPM SLTIERLSGP 
RNSLFSQLGG FAIPGLGPMV TKSPLLTTLV SLIPPMKEPP RILRGAFAAV IMGLGLGMES 
KYIKVATTDP ATGDRVAPNH LPHPSRNAEF LATQLQSAGY FQLCDDQALV VTIVPGNARY 
FVVPVTNLWT VTGNYWDEQT SLNNAQAVAN PDGSYTFVIS PTDTGVHNWV STGGLNKGTV 
SIRFQDLDLA SSKTPTVTSA VVPVSDLAAV LPPTTAYVTA AERQSQLSVR RAGFDRRFAD