Gene Namu_3910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3910
Symbol
ID	8449529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4316298
End bp	4317560
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	71%
IMG OID	645042956
Product	Extracellular ligand-binding receptor
Protein accession	YP_003203192
Protein GI	258654036
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.420808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.127498
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGCC GACGATTGAC CGGCCGGATC GCAGCCGGCA CCCTGGCCAC CGGCCTGCTG 
CTGGCCGCGT GTGGCAGCCC CGGTTCGTCG TCCTCGTCGC CGACCACGGC GGCCAGTGCC 
GCCAGTGCGG CCGGCGGCGG TTCGGCCGGC GCCTCCGCGC AGGCGGCCAC CGGTGAACCG 
ATCAAGGTCG GCGTCGTCAC CTCGCTGTCG GGGCCGCTGC AGTCCTACGG GCAGATGTAC 
CTGGACGCCT TCAACGTGTG CCTGGACCAC GCCACCAACG GCACCGGCGC GGTGAACGGC 
CGGCCGATCG CGGTGGCCAC CGCCGATGAC GCCGGCGATC CGGCCAAGGC AACCACCGCG 
GCCACCGACT ACATCGGCCA GGGCTACCAG ATCCTGGCCG GGTCCGCCTC GTCCGGGGTC 
GCCCTGCAGG TCGCCCCGCT GGCCCAGGAG AACCAGGTGC TGTTCATCTC CGGGCCGGCC 
GCCACCGACG CCATCACCGG GGTCAACAAG TACACGTTCC GCTCGGGACG CCAGACGTAC 
CAGGACATTG CGACCGCGGC GTCCTTCGTG GGCGATCTGC AGGGCAAGAA GGTGACGATC 
TTCGCCCAGG ACAGCGCGTT CGGCCAGGCC AACGTGGCCG CGGCCTCGGC CGTCTTCGGC 
GCCGAGGGGG CCACCGTCAC CCCGCTGCTG GTGCCGGCGA CCGCGACCGA CCTGGTGCCG 
TTCGCCAAGC AGGCCGCCGA CGCCGACCCG GATCTGCTGT TCGTGGCCTG GGCCGGCACC 
AACGCCACCC AGATGTGGGA GGCGATGGGC CAGCAGGGCG CGTTCGACGG CACCACCGTG 
GTCACCGGTC TGGACATCAA GCCCACCCAC ACCGTTTTCG CTCCGGTCGC GGACAAGCTC 
TCGCTGCTGG CCCACTACTT CGACGGCGCC ACCGACAACG AGGTGGAGCA GGCGCTGGTC 
GCCGGGCTGA CCGCGGAAGG CAAGACGCAG GATCTGTTCT CGCCGGACGG CTGCAACGCG 
GCGTTGATGG TGGTGCGGGC GGCGCAGGAG TCGCCGGACG ACGTGGACGG CATGATCACG 
GCGCTGGAGG GCTGGGAGTT CGAGGGTCCC AAGGGCACCA CCACGATCCG GGCCGAGGAT 
CACGCGATGC TGCAGCCAAT GTTCCAGACC AAGCTGGCCG ATGTGAACGG CACGCTGACC 
CCCGAACTGG TCAAGGAGCT GGCACCGGCG GACACCGCCC CGGCCGCGAC GCCCTTCAAG 
TGA

Protein sequence

MSRRRLTGRI AAGTLATGLL LAACGSPGSS SSSPTTAASA ASAAGGGSAG ASAQAATGEP 
IKVGVVTSLS GPLQSYGQMY LDAFNVCLDH ATNGTGAVNG RPIAVATADD AGDPAKATTA 
ATDYIGQGYQ ILAGSASSGV ALQVAPLAQE NQVLFISGPA ATDAITGVNK YTFRSGRQTY 
QDIATAASFV GDLQGKKVTI FAQDSAFGQA NVAAASAVFG AEGATVTPLL VPATATDLVP 
FAKQAADADP DLLFVAWAGT NATQMWEAMG QQGAFDGTTV VTGLDIKPTH TVFAPVADKL 
SLLAHYFDGA TDNEVEQALV AGLTAEGKTQ DLFSPDGCNA ALMVVRAAQE SPDDVDGMIT 
ALEGWEFEGP KGTTTIRAED HAMLQPMFQT KLADVNGTLT PELVKELAPA DTAPAATPFK