Gene Namu_5139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5139
Symbol
ID	8450770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5728351
End bp	5729568
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	66%
IMG OID	645044173
Product	aminotransferase class I and II
Protein accession	YP_003204397
Protein GI	258655241
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGA TCACCCAGAG TCTGAAACTG CGCGGCGTCC GCTACGACGT CCGGGGACCG 
ATCCTGGAGG AGGCCGAGCG CCTCGAGGCA CAGGGGCACA AGATCCTCAA GCTCAACATC 
GGCAACACCG CACCGTTCGG ATTCGACGCT CCCGACGCGA TCCTGGCCGA CATGATCCAC 
AACCTGCCGC AGTCCCAGGG CTACAGCGAC TCCCGCGGCA TCTACTCGGC CCGCACGGCC 
GTCGCGCAGT ACTACCAGTC GCGGGGTCTC AAGGACGTCG ACGTCGATGA CGTCTACATC 
GGCAACGGCG TGTCCGAGCT GATCTCCATG GTGCTGACCA CGTTCATCGA CGACGGCAAT 
GAGGTGCTCG TGCCGGCCCC GGACTACCCG CTGTGGACGG GCGCGGTCAC GCTGGCCGGC 
GGCACCCCGG TGCACTACCG CTGCGACGAG GCCAACGGTT GGATCCCCGA TCTTGAGGAC 
ATCGAGTCCA AGATCACCGA CGCCACCTTC GCGATCGTCA TCATCAACCC GAACAATCCC 
ACCGGCGCTG TCTACAGCGC GGACGTGGTG CGGGGCCTGG TCGACATCGC GCGCAAGCAC 
GATCTGGTGG TGATGGCCGA CGAGATCTAC GAGAAGATCA TCTTCGACGA TCACGTGCAC 
CACCACGCCG CCACCTTCGC CGGCGACGAC GTCCTGTGCC TGACGTTCAG CGGCCTGTCC 
AAGGCCTACC GGGTCTGCGG GTACCGGGCC GGCTGGGTCA TGGTCTCCGG GCCCACCCAT 
CTGGCCACCG ACTTCCTGGA GGGCCTGACC CTGCTGGCCA ACATGCGCAT GTGCGCGAAC 
GTGCCCGGCC AGCACGCCAT CCAGACCGCC CTGGGCGGGT ATCAGTCGGT CAACGAGCTG 
ATCGTTCCCG GCGGCCGGTT CTACGAGCAG AGCAAGCTCG CCTGGAACCT GCTGAACAAG 
ATCCCCGGGG TCAGCTGCAC CGAACCGCAG GGCGCGCTGT ACTGCTTCCC CCGGCTGGAT 
CCCGAGGTCT ACCCGATCGA CGACGACCAG GAATTCGTCA TCGACCTGCT GCGGGCCAAG 
AAGATCCTGG TCACCCACGG CACCGGGTTC AACTGGTTCC ACTCCGACCA CTTCCGGCTG 
GTCACCCTGC CGTCGGTGGA GATCCTGGAG GAGGCGATCG GCCGGATCGC CTCCTACCTG 
GAGTCGCTGC GCGAGTAG

Protein sequence

MRLITQSLKL RGVRYDVRGP ILEEAERLEA QGHKILKLNI GNTAPFGFDA PDAILADMIH 
NLPQSQGYSD SRGIYSARTA VAQYYQSRGL KDVDVDDVYI GNGVSELISM VLTTFIDDGN 
EVLVPAPDYP LWTGAVTLAG GTPVHYRCDE ANGWIPDLED IESKITDATF AIVIINPNNP 
TGAVYSADVV RGLVDIARKH DLVVMADEIY EKIIFDDHVH HHAATFAGDD VLCLTFSGLS 
KAYRVCGYRA GWVMVSGPTH LATDFLEGLT LLANMRMCAN VPGQHAIQTA LGGYQSVNEL 
IVPGGRFYEQ SKLAWNLLNK IPGVSCTEPQ GALYCFPRLD PEVYPIDDDQ EFVIDLLRAK 
KILVTHGTGF NWFHSDHFRL VTLPSVEILE EAIGRIASYL ESLRE