Gene Mvan_3851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3851
Symbol
ID	4649270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4114752
End bp	4116293
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	68%
IMG OID	639807317
Product	hypothetical protein
Protein accession	YP_954638
Protein GI	120404809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.116307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.432378
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTGTT CGCGGGAGGA CGTGTTGGGG GCTTTCGATG CCCTCGATAC GGTCGTGGAG 
TCGATCCTGG CGTTGGACTA CGACGCGCTC AGTGCGGCCG AGCGGGTGGG TCTGGATGCC 
CGGCTGGAAC GCAACCTGCG CCGGCTGCCG GTGGCCGAAC AGGCGTTGAT CGCCTCGGTG 
ATCGCCGAGA CTGAACCGGC CCGTCTCGGT GAGGGCAGCT GGAAAAAGGT GCTGATCACG 
GCGTTGCGGG TCAGTGGTGC CGAGGCGGGC CGACGGTTGA GGCGGGCCAA GGCCCTGGGC 
CCGCGGCGCG GGTTGACCGG GACGCCGTTG CCGCCGTTGT GGGAGTCCAC TGCTGCTGCG 
CAGGCCCAGG GCCTGCTTGG TGAGGAGCAC GTGGCGATCA TCGCGAAGTT CCACAAAGAC 
CTGCCGGCCT GGGTCGATGT CGACACCCGC GCCCATGCGG ATCGGCAGCT GGCCCGCAAG 
GGCGCCGGAC TCGGGCCCGA GGAACTCGAC GAGGCAGCGG GGCGGTTGAT GATGATGATC 
GACCAGGACG GCCCCGAACC CTGCGACAAA GAGCGGGCCC GCAAACGCGG TGTCCGGATC 
AGCAAGCAAC ATTCCGACGG CACCGCCACC ATCTCGGGCA CCCTGACCCC CGAAGCTCTG 
GCCGTCTGGC AGGCGATCTT CGCCAAAGAA GCCGCCCCCG GAGCCAACCT GCCCGAGTCT 
GAACACACCG AGGACAGCAC ATCCGGCGGC ACGCCGCGCG ACACCGAAAC CTCGGACCAC 
GCCGACGCAT CGGGTGACGG CGTGGCCCCC AGCAGCACGG CGGGTCACGG CAACACTTCG 
GGTGATGATG GTGGCGACGC GCCGGCTGAG GACCACGATC CACAGCCCGA ACGGTGCGGC 
TCTGATACCC GTACCCAGGC TCAGCGCAAC CACGACGCCT TCCTGGCCGT CGGACGCCGC 
CTGCTGGAAT CCGGAGAACT GGGCACCCAC AACGGGTTAC CGGTGACGGT GATCGTCTCC 
ACGACGCTGC AGGAGCTCGA AAAAGGCGCC GGGGTCGCGG TCACCGGCGG CGGATCGCTG 
TTGCCGATGC CCGACCTGAT CCGGCTGGCC GCCCGAGCCC ACCACTACCT CTACGTCTAC 
GACCAACACA GCGGCCAATC CCTCTACCTG GGCCGGGCCA AACGGTTGGC CAACGCCGCG 
CAGCGGATCG TGCTGCACGC CCGCGACCGC GGGTGTACGC GACCGGGCTG CACCGCACCC 
GGGTACTGGT GCCAGGCCCA CCACGCCAGC GCCGATTTCG TCAACGGCGG ACTGACCAAC 
ATCGACGACC TGACCCTGGC ATGCCCGTGC GATCACCGCA TGCTCGACAA CACCGGCTGG 
CGCACCCGCA AAAACGGCAA AAACCAGACC GAATGGCTCC CACCACCAGA CCTCGACACA 
GGCCAACACC GCGTCAACGG CCACCACCAC CCCGAACGCC ACCTACTCCC CGAAGACAAC 
CTCCCCGAAG ACGACCTCCC CGAGGACGAC CAAGGCCCGT AG

Protein sequence

MGCSREDVLG AFDALDTVVE SILALDYDAL SAAERVGLDA RLERNLRRLP VAEQALIASV 
IAETEPARLG EGSWKKVLIT ALRVSGAEAG RRLRRAKALG PRRGLTGTPL PPLWESTAAA 
QAQGLLGEEH VAIIAKFHKD LPAWVDVDTR AHADRQLARK GAGLGPEELD EAAGRLMMMI 
DQDGPEPCDK ERARKRGVRI SKQHSDGTAT ISGTLTPEAL AVWQAIFAKE AAPGANLPES 
EHTEDSTSGG TPRDTETSDH ADASGDGVAP SSTAGHGNTS GDDGGDAPAE DHDPQPERCG 
SDTRTQAQRN HDAFLAVGRR LLESGELGTH NGLPVTVIVS TTLQELEKGA GVAVTGGGSL 
LPMPDLIRLA ARAHHYLYVY DQHSGQSLYL GRAKRLANAA QRIVLHARDR GCTRPGCTAP 
GYWCQAHHAS ADFVNGGLTN IDDLTLACPC DHRMLDNTGW RTRKNGKNQT EWLPPPDLDT 
GQHRVNGHHH PERHLLPEDN LPEDDLPEDD QGP