Gene Mvan_5601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5601
Symbol
ID	4646145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5979147
End bp	5980097
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	65%
IMG OID	639809074
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_956372
Protein GI	120406543
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGCT CCCGACGAAC CAGGCGCGCA GCTGTGGCGG TTGCCATCGC GCTTCTCGCA 
GCGGTGCTCA GCGCCTGCGG CAGCTCCAAT CCACTCGGTG GCGGCGAGAT CTCCGGTGAC 
CTCAAGTCGA TCAAGGTGGG TTCGGCGGAC TTCACCGAAT CGAAGATCAT CGCCGAGATC 
TACGCCCAGG CGCTAGAGGC CAACGGGTTC ACGATCTCCC GCCAGTTCGG TATCGGCAGC 
CGCGAGACGT ACATCCCCGC GGTGCGGGAC CACTCGATCG ACCTGATCCC GGAGTACACC 
GGCAACCTGC TGCAGTACTT CGACCCCGAG AGCGCTGCCA CGACACCGGA TTCGGTGCTG 
CTCGGCCTGT TGAAGGCGCT TCCCGGCGAC CTGTCGATCC TGTATCCGTC GCCCGCGGAG 
GACAAGGACA CCCTCGCGGT GTCGGCGGAG ACCGCGCAGC GCTGGAACCT GAAGTCGATC 
GCAGACCTGG CTGCACATTC CGCTGAGGTG AAAGTCGGTG CGCCGTCGGA GTTTCAGACC 
CGGCAGACCG GTCTGGTAGG GCTCAAGGAG AAGTACGGCC TGGACATCGC GCCGGCGAAC 
TTCGTCGCGA TCAGCGACGG CGGCGGTCCC GCGACGGTCA AGGCGCTGAC CGACGGAACG 
GTCACCGCGG CCAACATCTT CAGCACGTCA CCGGCGATCG AACGCAGCGC GCTGGTGGTG 
TTGGAGGATC CGAAGAACGT GTTCCTGGCC GCGAACGTGG TGCCGCTGGT GGCCTCGCAG 
AAGATGTCGA ACGAACTCAA GACCGTGCTG GACGCCGTCA GTGCCAAGCT GACCACCGAG 
GCCCTGATCG AGTTGAACAC CTCGGTCGAG GGCAATCAGG GAGTCGACCC CGACGAGGCG 
GCGCGGAAGT GGATATCCGA CAACGGCTTC GACACGCCCA TCGGGAAGTA G

Protein sequence

MICSRRTRRA AVAVAIALLA AVLSACGSSN PLGGGEISGD LKSIKVGSAD FTESKIIAEI 
YAQALEANGF TISRQFGIGS RETYIPAVRD HSIDLIPEYT GNLLQYFDPE SAATTPDSVL 
LGLLKALPGD LSILYPSPAE DKDTLAVSAE TAQRWNLKSI ADLAAHSAEV KVGAPSEFQT 
RQTGLVGLKE KYGLDIAPAN FVAISDGGGP ATVKALTDGT VTAANIFSTS PAIERSALVV 
LEDPKNVFLA ANVVPLVASQ KMSNELKTVL DAVSAKLTTE ALIELNTSVE GNQGVDPDEA 
ARKWISDNGF DTPIGK