Gene Mvan_5735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5735
Symbol
ID	4644190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	6125602
End bp	6126927
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	71%
IMG OID	639809211
Product	hypothetical protein
Protein accession	YP_956506
Protein GI	120406677
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3281] Uncharacterized protein, probably involved in trehalose biosynthesis
TIGRFAM ID	[TIGR02457] trehalose synthase-fused probable maltokinase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.139677
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTGG CATTCGGCGA TTGGATCGTG CACCGCCGCT GGTACGCCGG CCGCAGCCGC 
GAACTCGTCT CGGCCGAGCC TGCGGTGGTG ACCCCGCTGC GCGATGACCT CGACCACATC 
CTGCTCGACG TGACCTACAC CGACGGCACC GTCGAGCGCT ATCAACTCGT GGTCAGGTGG 
GCCGACAGTC CGGTGGCCGG CTTCGGTGAA GCCGCCACCA TCGGCACCGC CCTGGGCCCG 
CAGGGGGAAC GGATCGCCTA CGACGCGCTG TTCGACCCCG ACGCCGCCCG CCATCTGCTG 
CGCCTGGTCG ATGCGTCGGC CACCGTCGCC GATCTGAGGT TCACCAGGGA ACCGGGTGCC 
ACGCTGCCGC TGTACGCGCC GCCGAAGGTG TCGAGCGCCG AGCAGAGCAA CACCAGCGTG 
ATCTTCGGAA AAGACGCCAT GCTCAAGGTG TTCCGCCGGG TGACGCCGGG CATCAACCCC 
GATATCGAGC TCAACCGGGT GCTCGCCCAG GCGGGCAATC GGCACGTCGC AAGGCTCCTC 
GGTTCGTTCG AGACGTCGTG GGCGGGTCCG GGCACGGACC GCTGCGCGCT CGGCATGGTG 
ACGGCCTTCG CCGCGAACAG CGCCGAAGGC TGGGACATGG CCACGGCCAG TGCCCGCGAG 
ATGTTCGCCG ACGTGGTGGG CAGCGACTTC GCCGACGAGT CCTACCGGCT CGGGAACGCG 
GTGGCCTCGG TGCACGCCAC CCTCGCCGAA GCCCTCGGTA CCTCGACCGA GCCGTTCCCG 
GTCGACACCG TGCTGGCCCG GCTGCAGTCG GCCGCACGGT CCGCGCCGGA GCTCGCGGGC 
CGCGCCGCGG CGGTCGAGGA ACGATACCGA CGGCTCGACG GGCGGGCGAT CACCGTGCAG 
CGGGTACACG GCGACCTGCA TCTCGGTCAG GTGCTGCGCA CCCCGGACGA CTGGTTGCTC 
ATCGACTTCG AAGGTGAACC CGGCCAACCG CTGGACGAAC GCAGGCGGCC GGACTCGCCG 
CTGCGCGACG TGGCCGGCGT GCTGCGGTCC TTCGAGTACG CGGCCTACCA GAAGCTGGTG 
GAGCTGGCCC CCGAACAGGA CGCCGACGGT CGACTCGCGG ACAGGGCGCG CAACTGGGTG 
GACCGCAACA GCGCCGCGTT CTGCGCCGGG TACGCGGCGG TCGCAGGGGA CGACCCGCGC 
CGGGACGGCG ACGTGCTGGC TGCCTACGAG CTCGACAAGG CGGTGTACGA AGCCGCTTAC 
GAGGCCCGTT TCCGGCCGTC CTGGTTGCCC ATCCCGATGA GATCGATCGA CCGCATCCTG 
GGCTGA

Protein sequence

MTLAFGDWIV HRRWYAGRSR ELVSAEPAVV TPLRDDLDHI LLDVTYTDGT VERYQLVVRW 
ADSPVAGFGE AATIGTALGP QGERIAYDAL FDPDAARHLL RLVDASATVA DLRFTREPGA 
TLPLYAPPKV SSAEQSNTSV IFGKDAMLKV FRRVTPGINP DIELNRVLAQ AGNRHVARLL 
GSFETSWAGP GTDRCALGMV TAFAANSAEG WDMATASARE MFADVVGSDF ADESYRLGNA 
VASVHATLAE ALGTSTEPFP VDTVLARLQS AARSAPELAG RAAAVEERYR RLDGRAITVQ 
RVHGDLHLGQ VLRTPDDWLL IDFEGEPGQP LDERRRPDSP LRDVAGVLRS FEYAAYQKLV 
ELAPEQDADG RLADRARNWV DRNSAAFCAG YAAVAGDDPR RDGDVLAAYE LDKAVYEAAY 
EARFRPSWLP IPMRSIDRIL G