Gene Mvan_0228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0228
Symbol
ID	4647966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	243506
End bp	244936
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	66%
IMG OID	639803737
Product	hypothetical protein
Protein accession	YP_951083
Protein GI	120401254
COG category
COG ID
TIGRFAM ID	[TIGR02946] acyltransferase, WS/DGAT/MGAT

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.393674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.149834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAGGC TTAGTGGCTG GGACGCTGTG CTGCTGTACA GCGAGACCCC GAACGTCCAC 
ATGCACACGC TCAAGTTGGC CGTCATCGAG CTCGACGACA CGTTCGCCCG GGAAGGCGGT 
GCGACCTTCG GTGTCGAGGA GCTTCGCAAG GTCATCCACG GACGGCTCTA CAAACTCGAC 
CCGTTCCGCT ACCAGCTGAT CGACATCCCG TTCAAGTTCC ACCACCCGAT GTGGCGGGAG 
AACGCCGAGG TCGACCTCGA ATACCACGTT CGGTCATGCC GTGTCGATGC GCCGGGCGGT 
CGTCGCGAGC TCGACGAGGC GGTGGGCAGG ATCGCGAGTA CCCCGCTGGA CCGCAGCCGA 
CCGCTGTGGG AGATGTACCT GATCGAAGGT CTGGCGGGCG GCCGGATCGC GGTACTCGGA 
AAGATCCATC ACGCCCTGGC CGACGGTGTC GCGTCGGCGA ACCTGCTGGC GCGCGGCATG 
GATCTGCAGG ACAGCCCGCA GGCCGACCGG GACTCCTACG CCACCGACCC GGCCCCGACC 
CGGGGCGAGC TGGTCCGGTC GGCGTTCACC GATCATCTCC GGCAGATCGC CAAGCTGCCC 
GGGGTGGTGC GCTACACCGC CCAGGGGGTG CGTCGGGTGC AGCGCAGCGA GCGCAAGCTC 
TCGCCCGAGC TGACGCGACC GTTCACCCCG CCGCCGACGT TCATGAACCA CATGGTCGAC 
GCCACCCGCA GGTTCGCCAC CGCCACCGTG GCGCTCGACG ACGTCAAGCA GACCGGCAAG 
CAGCTGGGCG TCACCATCAA TGACATGGTG CTGGCGATGT CCGCAGGGGC ATTGCGAAAG 
TTGTTGCTGC GGTACGACGG TCGTGCCGAT CATGCGCTGC TGGCGTCGGT GCCGGTGAGT 
TTCGACTTCT CCCGCGACCG GATCTCCGGT AACTACTTCA CCGGTGTGCT GGTCAGCCTC 
CCGGTGGACG TCGAGGATCC GCTGGAACGG GTCAGCGCCG CCCACACCGC CGCGGCGGCG 
GGCAAGGAGA GCAACAACCT GATCGGTCCC GAGTTGGTCA GCCGGTGGTC GGCTTATTTC 
CCGCCGGCCC CGGCCGAGGC GATGTTCCGC TGGCTGTCGA ACAAGGATGG CCAGAACAAG 
GTGATGAACC TGCCGATCTC CAACGTGCCG GGTCCCCGCG AGCGCGCCCG TGTCGGCGGT 
GCGTTGGTCA CCGAGATCTA CTCCGTCGGC CCGCTCACCG CGGGCAGCGG CCTCAACATC 
ACCGTGTGGA GCTACGTCGA CCAGATCAAC ATCTCGGTGC TTTCGGACGG CAAGACGCTC 
GACGATCCCC ATGAGCTCAC CACGGCCATG GTCGACGAGT TCATCGAGAT ACGCCGTGCC 
GCAGGACTTT CCACGGAGCT GACGGTGATC GAAACGGCGA TGGCCAACTA G

Protein sequence

MKRLSGWDAV LLYSETPNVH MHTLKLAVIE LDDTFAREGG ATFGVEELRK VIHGRLYKLD 
PFRYQLIDIP FKFHHPMWRE NAEVDLEYHV RSCRVDAPGG RRELDEAVGR IASTPLDRSR 
PLWEMYLIEG LAGGRIAVLG KIHHALADGV ASANLLARGM DLQDSPQADR DSYATDPAPT 
RGELVRSAFT DHLRQIAKLP GVVRYTAQGV RRVQRSERKL SPELTRPFTP PPTFMNHMVD 
ATRRFATATV ALDDVKQTGK QLGVTINDMV LAMSAGALRK LLLRYDGRAD HALLASVPVS 
FDFSRDRISG NYFTGVLVSL PVDVEDPLER VSAAHTAAAA GKESNNLIGP ELVSRWSAYF 
PPAPAEAMFR WLSNKDGQNK VMNLPISNVP GPRERARVGG ALVTEIYSVG PLTAGSGLNI 
TVWSYVDQIN ISVLSDGKTL DDPHELTTAM VDEFIEIRRA AGLSTELTVI ETAMAN