Gene Mvan_5043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5043
Symbol
ID	4644780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5398058
End bp	5399089
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	639808514
Product	putative glutathione S-transferase
Protein accession	YP_955821
Protein GI	120405992
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.939861
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTACG TCGCCGACCC GTCGAGCTCT GGCGGGGAGT TCAACCGGGA CACCGAATAC 
ATCTCCACCC GGATCACCGC CGACGGGCGG GACGGCTATC CCGTCGAGCC GGGCCGCTAT 
CGGCTCATCG TTGCCCGAGC GTGCCCATGG GCCAACCGCA CCATCATCGT GCGGCGGCTG 
CTCGGGCTGG AAGATGTTCT GTCCATAGGC TTTTGCGGCC CGACCCATGA TGAGCGCAGC 
TGGACGTTCG ACCTCGATCC CGGTGGTGTC GACCCGGTGC TGGGCATTCA CTTCCTGCGC 
GACGCCTACA ACAAACGTGT GCGCGACTAC CCCAAGGGTG TCACCGTCCC GGCCGTCGTG 
GAGGTCGCGA CGGGAGAGGT CGTCACCAAC GACTTCGCGC AGATCACCCT GGACTTCTCC 
ACCGAGTGGA CCGCCTACCA CCGCGACGGC GCACCGCAGC TCTATCCCGA ACCGCTGCGC 
GACGAGATCG ACGAGGTCGC CCAGCGCGTC TACACCGAGG TCAACAACGG CGTCTACCGG 
TGCGGTTTCG CGGGGTCCCA GCGGGCCTAC GAGAAGGCAT ACGACCGGTT GTTCACCGCG 
CTGGACTGGC TGTCCGAGCG GCTGTCGCGG CAGCGCTTCC TGGTGGGCGA CACCATCACC 
GAGGCAGACG TACGACTATT CACCACACTG GCTCGATTCG ACCCCGTGTA TCACGGCCAC 
TTCAAGACCA ATCGCAGCAA GCTCTCCGAG ATGCCGGTGC TGTGGGCATA CGCACGCGAC 
CTGTTTCAGA CGCCGGGGTT CGGTGACACC ATCGACTTCG TGCAGATCAA GCAGCACTAC 
TACATCGTTC ACTCCGACAT CAATCCCACC GGCATCGTCC CGAAGGGGCC GGAGCTGTCG 
AACTGGCTGA CGCCGCACGG TCGAGAAGCG TTGGGCGGCA GACCGTTCGG TGACGGAACC 
GCCCCCGGGC CGACGCGGGA CACCGAGCGC GTGCCCGAGG GTCACACAGC CGGCGACTCG 
CAACCCGGAT GA

Protein sequence

MTYVADPSSS GGEFNRDTEY ISTRITADGR DGYPVEPGRY RLIVARACPW ANRTIIVRRL 
LGLEDVLSIG FCGPTHDERS WTFDLDPGGV DPVLGIHFLR DAYNKRVRDY PKGVTVPAVV 
EVATGEVVTN DFAQITLDFS TEWTAYHRDG APQLYPEPLR DEIDEVAQRV YTEVNNGVYR 
CGFAGSQRAY EKAYDRLFTA LDWLSERLSR QRFLVGDTIT EADVRLFTTL ARFDPVYHGH 
FKTNRSKLSE MPVLWAYARD LFQTPGFGDT IDFVQIKQHY YIVHSDINPT GIVPKGPELS 
NWLTPHGREA LGGRPFGDGT APGPTRDTER VPEGHTAGDS QPG