Gene Namu_4137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4137
Symbol
ID	8449763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4573471
End bp	4574589
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	645043186
Product	phenylalanyl-tRNA synthetase, alpha subunit
Protein accession	YP_003203415
Protein GI	258654259
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0016] Phenylalanyl-tRNA synthetase alpha subunit
TIGRFAM ID	[TIGR00468] phenylalanyl-tRNA synthetase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00000247925
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000347333
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCACCG CCTCGCCCTC GTCGGCCGCG CCCAGCTCCG CGGTGCAGTC CGATCAGGGA 
CTCGCCCTGC CCCTGGACCC GACCGACGAG GCCGGGATCG AGCGGGCCGT GACCGCGGCC 
CTGGCCGCCG TCGCCGCGGC CGCCGACCTG GACGCGCTCA AGACCGTCCG GTTGGCCCAC 
GCCGGGGACC GCAGCCCGCT CGCCCTGACC AACCGGGCCC TGGCCGACCT GCCCAAGACC 
GAACGGGCCG CGCCGGGCAA GTTCATCGGA CAGAGCCGGC GCCGGGTGGC CGACGCCGTC 
GCCGTCCGGG AGAGCGAGCT GATCGCCGAA CGGGACGCCC GCATCCTGCG CGAGGAGACC 
GTCGACGTCA CGCTGCCCTA CGACCGGGAG CCGGCCGGGG CGCGTCACCC GATCTCCACC 
ATCATGGCCC GGATCGAGGA CGTCTTCGTG GCCATGGGCT GGGAGGTGGC CACCGGCCCC 
GAGCTGGAGG CCGAGTGGTT CAACTTCGAT GCACTGAACT TCCCCAAGGA CCATCCGGCG 
CGGGCCATGC AGGACTCGTT CTACATCGCC GGTGACGGGC CCGGCGGCAC GGGCAGCGGG 
CTGGTGCTGC GCACCCACAC CTCGCCGGTG CAGATCCGCA GCATGCTCGA CCGGGAGCCG 
CCGATCTACG TGGTCTGCCC GGGCCGGGTG TACCGCTCGG ACGAACTGGA CGCCACCCAC 
ACGCCGGTGT TCCACCAGGT CGAGGGGCTG GCCATCGACC GTCACCTGTC GATGGCGCAC 
CTGAAGGGGA CGCTGGACCA CTTCGCCCGG GCCATGTTCG GTCCGGAGTC GACGACCCGG 
CTGCGGCCCT CGTTCTTCCC GTTCACCGAG CCCAGCGCCG AGATGGACGT CTACTTCCCG 
GACAAGAAGG GTGGTCCGGG CTGGGTGGAG TGGGGCGGCT GCGGCATGGT CGATCCGAAC 
GTGCTGATCG CCTGCGGGCT GGACCCGAAC GAGTGGAGCG GCTTCGCCTT CGGCATGGGC 
ATCGAGCGGA CCCTGCAGTT CCGCAACCAG ATTCCGGACA TGCGGGACCT GGTCGAGGGT 
GACGTCCGGT TCACCACCGC ATTCGGCTGG GAGGTCTGA

Protein sequence

MTTASPSSAA PSSAVQSDQG LALPLDPTDE AGIERAVTAA LAAVAAAADL DALKTVRLAH 
AGDRSPLALT NRALADLPKT ERAAPGKFIG QSRRRVADAV AVRESELIAE RDARILREET 
VDVTLPYDRE PAGARHPIST IMARIEDVFV AMGWEVATGP ELEAEWFNFD ALNFPKDHPA 
RAMQDSFYIA GDGPGGTGSG LVLRTHTSPV QIRSMLDREP PIYVVCPGRV YRSDELDATH 
TPVFHQVEGL AIDRHLSMAH LKGTLDHFAR AMFGPESTTR LRPSFFPFTE PSAEMDVYFP 
DKKGGPGWVE WGGCGMVDPN VLIACGLDPN EWSGFAFGMG IERTLQFRNQ IPDMRDLVEG 
DVRFTTAFGW EV