Gene Namu_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1104
Symbol
ID	8446700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1226710
End bp	1227816
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	66%
IMG OID	645040241
Product	protein of unknown function DUF1016
Protein accession	YP_003200500
Protein GI	258651344
COG category	[S] Function unknown
COG ID	[COG4804] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.41725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGCGA ACGACCTCCC AGATCGCACT GGCTTCCCGC CGACCCCGAG CCACGTCGGC 
CTGCCCGGGT GGTACCCAGA ACTGCTGGAC TCGGTCGCCG GTCGGATCAC CGCTGGCCGG 
CAGCGGGCGA CCGGGGCGGT CAACCGGGAG CTGGTCCTGA GCTACTGGGC GATCGGCCGG 
GACATCCTGG ACCGGCAGGA GCAGGAGGGC TATGGCACCA GGGTCATCGA CCGGCTCTCG 
GCCGACCTCA AAGGGCGGTT CCCGGACGCT AAAGGGTTCT CGCCGCGCAA CCTGAAGTAC 
ATGCGGAAGT TCGCCGAGGC CTGGCCCGAC CCGGCAGTTG TGCAAGGGAC CCTTGCACAA 
CTGCCGTGGT GGTCCCAGAT CGCTCTGATG GAGAAGCTGC ACGACCCTGA GCAGCGGCTT 
TGGTACGCCG CCGAGGCCAT TGAAGCGGGC TGGAGCCGGG ACATCCTGGC CCTGCAGATC 
GACCTCAAGT TGCACGATCG CAAGGGCCGG GCGATCACCA ACTTCGCCGG CACCATGCCG 
CCCGCCGACT CGGACATGGC CCAGCAGGCG ACCAAGGACC CGTACGTGTT CGACTTCCTC 
GATCTCACCG AGCGCAGCCG AGAGCGGGAG CTCGAGACCG GGCTGGTAGA GCACGTCGGG 
AAGTTCCTGC TCGAACTCGG GCAGGGATTT GCCTTCGTCG GCCGGCAGGT GCGACTTGAG 
GTGGACGGCG AAGAGTTCTA CTGCGACCTG CTCTTCTACC ACCTGAAGCT GCGGCGATAC 
GTCGTCATCG AACTCAAGGC CGTGAAGTTC GAGCCCGGCT TCCTCGGCCA GTTGGGCATG 
TACATGGCTG CGGTCGACGA CCTGCTCGCC CACCCGACGG ACGAGCCGAC CATCGGGTTG 
ATGCTCTGCA AGGGCAAGAA CGATGTGGTC GCCGAGTGGG CGCTGCGCGG CTACTCCTCG 
CCGATCGGCG TCTCCGACTG GACCACCGCA ATTTCCACCG CGCTGCCGGA CGACCTGGCA 
TCGAGCCTGC CCAGCATCGA GGAGATCGAG GCCGAGCTGT CCGATCCGAG TTCGAGCCAG 
ACGGACAACA GCGACACCAC GGACTGA

Protein sequence

MSANDLPDRT GFPPTPSHVG LPGWYPELLD SVAGRITAGR QRATGAVNRE LVLSYWAIGR 
DILDRQEQEG YGTRVIDRLS ADLKGRFPDA KGFSPRNLKY MRKFAEAWPD PAVVQGTLAQ 
LPWWSQIALM EKLHDPEQRL WYAAEAIEAG WSRDILALQI DLKLHDRKGR AITNFAGTMP 
PADSDMAQQA TKDPYVFDFL DLTERSRERE LETGLVEHVG KFLLELGQGF AFVGRQVRLE 
VDGEEFYCDL LFYHLKLRRY VVIELKAVKF EPGFLGQLGM YMAAVDDLLA HPTDEPTIGL 
MLCKGKNDVV AEWALRGYSS PIGVSDWTTA ISTALPDDLA SSLPSIEEIE AELSDPSSSQ 
TDNSDTTD