Gene Namu_5131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5131
Symbol
ID	8450762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5718700
End bp	5719890
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	72%
IMG OID	645044165
Product	aminotransferase class I and II
Protein accession	YP_003204389
Protein GI	258655233
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAT CGGGCCGTCG CGGCGACGAG ATCATCGGCA AAGCCGCCGG TCTCGGGCCG 
TCCCACCGGT CCCGGGTGGC GCCGTTCTAC GTGATGCAGG TGCTCGCCGC GGCGGCCCGT 
CGGCGGGCCG CCGGCGAGGT GGTCTGGGAC CTGGCCGCCG GGCAGCCGTC CACCCCGGCC 
CCGGAGCCCG TGCGGCGGGC GGCGCACGCC ACGCTCGACT CGCACATCCT GGGATACACC 
GAGGCGCCGG GGATCCGGCC CCTGCGGGAG GCTATCGCCG GGCACTACCG CGACCGCTAC 
GCGCTGGCCG TGGACGCTGA CAACGTCGTC GTCACCACCG GGTCCTCGGG CGGATTCCTG 
CTCGCCTTCC TGGCCGCATT CGACGTGGGC AGCCGGGTCG GGTTGGCCCG CCCGGGGTAC 
CCGGCCTACC GGAACATCCT GCACGCCCTG GGCTGTGCGG TCGTTGACCT GCCGTGCGGA 
CCGGAAACCC GGTACCAGCC GACGGTGTCG ATGGTCCGGG AGCACGACCT GGACGGGTTG 
ATCGTGGCCA GCCCGGCCAA CCCGACCGGC ACCATGCTCG AACCGGGGGA GCTGGCGGCA 
CTGGCCACCT GGAGCGCCGG AAACGCGGTC CGGCTGGTCT CGGACGAGAT CTACCACGGC 
ATCACCTACA CCGGCAGCAC CAGCAGCAGT TGGCAGACCG ACCGGCACGG CATCGTGGTG 
AACTCGTTCT CCAAGTACTT CTCGATGACC GGCTGGCGCA TCGGGTGGCT GCTGGTTCCC 
GACGATCTGG TCGAGGTGGT CGATGCGCTG GCCGGCAACC TGGCCATCTG CCCGCCCGCC 
CCGGCCCAGT ACGCGGCGAT GGCCGCCTTC GAGGCCTACG CCGAATGCGA CGGTCACGTG 
CAGCGCTACG CGCAGCACCG CGATCTGCTG CTGGGCGGCC TGCGCCGGCT CGGCTTCGAC 
CGGCTCGCCC CGGCCGACGG GGCGTTCTAC GTGTACGCCG ACATCGGCGA CCTGACCTCG 
GATTCCACCG CGTTCTGCGC CCGGTTGCTG GCCGAGGCCG GTATCGCCGC CGCCCCGGGC 
GTGGACTTCG ACGTCGTCGA CGGCCACCGG TTCCTGCGGT TCTCCTTCGC CGGGTCGATG 
CGGACGATCG AGGGTGCGTT GGACGCGCTG GAACGGTTCC TGGCCGGCTG A

Protein sequence

MTGSGRRGDE IIGKAAGLGP SHRSRVAPFY VMQVLAAAAR RRAAGEVVWD LAAGQPSTPA 
PEPVRRAAHA TLDSHILGYT EAPGIRPLRE AIAGHYRDRY ALAVDADNVV VTTGSSGGFL 
LAFLAAFDVG SRVGLARPGY PAYRNILHAL GCAVVDLPCG PETRYQPTVS MVREHDLDGL 
IVASPANPTG TMLEPGELAA LATWSAGNAV RLVSDEIYHG ITYTGSTSSS WQTDRHGIVV 
NSFSKYFSMT GWRIGWLLVP DDLVEVVDAL AGNLAICPPA PAQYAAMAAF EAYAECDGHV 
QRYAQHRDLL LGGLRRLGFD RLAPADGAFY VYADIGDLTS DSTAFCARLL AEAGIAAAPG 
VDFDVVDGHR FLRFSFAGSM RTIEGALDAL ERFLAG