Gene Mkms_4784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4784
Symbol
ID	4616199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	5015394
End bp	5016581
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID	639794475
Product	aspartate aminotransferase
Protein accession	YP_940764
Protein GI	119870812
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.292543
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGAG CCCACGCACA ACGCACCGAG CCGCGGGACG TGGCCCTACG CGCCGGCATC 
CCGCCGTTCT ACGTGATGGA CGTCTGGCTG GCCGCCGCGG AACGGCAACG CACCCACGGC 
GACCTGGTCA ACCTGTCGGC CGGCCAACCG AGCGCCGGCG CGCCGACGGC GGTGCGCGAG 
GCCGCCATCG CAGCGCTGCA GGAGAACCAA CTGGGCTACA CCGTCGCGCT CGGCATCCCG 
GAACTGCGCG AGGCGATCGC CGCACGGTAC GCCGACCAGT TCGGCCTGAC GGTCGGGCTC 
GACGACGTCG TGCTGACCAC CGGGTCGTCG GGCGGATTCC TGCTCGCGTT CCTGGCGTGC 
TTCGACGTGG GTGACCGGGT GGCGATCGCC AGCCCCGGCT ACCCCTGCTA CCGCAACATC 
CTGACCGCGC TCGGGTGCGA GGTCGTCGAG ATCCCCTGCG GTGCGGACAC CCGTTTCCAA 
CCCACCGCCG CGATGCTCGC CGAACTCGAT CCGCCGGTGC AGGGCGTGAT CGTGGCAAGC 
CCCGCCAACC CCACCGGCAC GGTCATCGCG CCCGCTGAAC TCGCCGCGAT CGCCACCTGG 
TGTGAGGCGA CCGGCACCCG GCTGATCAGC GACGAGGTCT ACCACGGACT CGTCTACGAC 
GGCGCCCCGC CGATCAGCTG CGCGTGGCAG ACCTCGCGCA AAGCCGTGGT GGTCAACAGC 
TTTTCCAAGT ACTACGCGAT GACCGGGTGG CGGCTGGGCT GGCTGCTGGT GCCGCAGGAA 
CTGCGCCGCG CCGTCGACCG GCTCACCGGC AACTTCACTA TCTGCCCGCC CGCGCTGGCT 
CAGCACGCCG CGGTGGCCGC GTTCACCCCG GAGTCGACCG CGGAGGCCGA CGGTCTGCTG 
GCCCACTACG CCGAGAACCG GCGGCTGTTG CTCGACGGGC TGCGCGCCAT CGGCATCAGC 
CGGCTGGCGC CCGCCGACGG CGCGTTCTAC GTCTACGCCG ATGTCTCGCA TCTGACCGAC 
GCCTCGTTGT CGTTCTGCGC GAAGCTGCTG GCCGACACCG GAGTCGCGAT CGCACCCGGT 
ATCGACTTCG ACACCGTGCA CGGCAACTCG TTCGTCAGGC TGTCGTTCGC CGGGCCGACG 
GCCGACATCA CCGAGGCGTT GAGCCGCATC GGGGGCTGGC TGCGCTGA

Protein sequence

MSGAHAQRTE PRDVALRAGI PPFYVMDVWL AAAERQRTHG DLVNLSAGQP SAGAPTAVRE 
AAIAALQENQ LGYTVALGIP ELREAIAARY ADQFGLTVGL DDVVLTTGSS GGFLLAFLAC 
FDVGDRVAIA SPGYPCYRNI LTALGCEVVE IPCGADTRFQ PTAAMLAELD PPVQGVIVAS 
PANPTGTVIA PAELAAIATW CEATGTRLIS DEVYHGLVYD GAPPISCAWQ TSRKAVVVNS 
FSKYYAMTGW RLGWLLVPQE LRRAVDRLTG NFTICPPALA QHAAVAAFTP ESTAEADGLL 
AHYAENRRLL LDGLRAIGIS RLAPADGAFY VYADVSHLTD ASLSFCAKLL ADTGVAIAPG 
IDFDTVHGNS FVRLSFAGPT ADITEALSRI GGWLR