Gene Namu_1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1120
Symbol
ID	8446716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1249133
End bp	1250227
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	71%
IMG OID	645040257
Product	protein of unknown function DUF808
Protein accession	YP_003200516
Protein GI	258651360
COG category	[S] Function unknown
COG ID	[COG2354] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGGTC TGTTCGCCCT GCTGGACGAC GTCGCGGCGC TGGTAAAGCT GACGGCGTCT 
TCGCTCGACG ACATCGCCGG GGCGACGGGC CGGGCCAGTG TGAAGGCCGC CGGGGTGGTC 
GTCGACGACA CCGCGGTCAC CCCGCGCTAC GTGCAGGGCC TCAAGCCCGA GCGTGAGCTG 
TCGATCATCT GGCGCATCGC CAAGGGCTCG CTGCGCAACA AGCTGCTGAT CATCCTGCCG 
GTCGCGCTGC TGCTGTCCCA GTTCGCGCCG TGGGCCCTGA CCCCGATCCT GATGGTCGGC 
GGCACGTACC TGTGTTACGA GGGTGCGGAG AAGCTGTGGG AGAAGTTCTC CGGCCACGAG 
GCGCAGGCCC AGGACCCGGA CGAGGTCGAG GCCGTCGACC CGGCCGAGCA CGAGAAGCGG 
GTCGTCTCCT CGGCCACCCG CACCGACTTC ATCCTCTCCG CCGAGATCAT GGTCATCGCG 
CTGGACGAGG TGGCCAGCGA GGGCTTCGTC GCCCGGGCCA TCATCCTGGC CATCGTCGCG 
GTCCTGATCA CCGCGCTGGT CTACGGCGTC GTCGGCCTGA TCGTGAAGAT GGACGACGCC 
GGGCTGGCCC TGGCCCGCAA GCCCAGGCGC GCGGTGGCCG GCTTCGGGCG CGGCCTGGTC 
AAGGCCATGC CCATCGTGCT GAGCACCCTG TCCTGGGTCG GCGTGGTGGC CATGCTCTGG 
GTCGGCGGGC ACATCCTGCT GGTCGGCATG GACGAGCTGG GCTTCCATCT GCTCTACGGC 
TGGGTGCACC ACCTGGAAAC CGCTGTGCAC GACGCCACCG GCGGGGCCGG GGCCGCCCTG 
GGCTGGGTGA CCAACACGTT CTTCTCGGCC GTCCTGGGCC TGCTGGTGGG CGCCATCGTG 
GTCGCTGTGC TGCACGTGTT GCCGATCGGG CGCAAGACGG CCGGCCATGG CGCCGACGAC 
GGGGCTGCGG GGCACGGGGC TGCGGGGCAC GGGGCCGGCC CGGCCACCCC CGATCCGGCC 
ACCCCCGATC CGGCCACCCC CGATCCGGGC CCGTCCGAGC GGAGCACGCC CGATCCGGAT 
GAGCCCAAGG GCTGA

Protein sequence

MSGLFALLDD VAALVKLTAS SLDDIAGATG RASVKAAGVV VDDTAVTPRY VQGLKPEREL 
SIIWRIAKGS LRNKLLIILP VALLLSQFAP WALTPILMVG GTYLCYEGAE KLWEKFSGHE 
AQAQDPDEVE AVDPAEHEKR VVSSATRTDF ILSAEIMVIA LDEVASEGFV ARAIILAIVA 
VLITALVYGV VGLIVKMDDA GLALARKPRR AVAGFGRGLV KAMPIVLSTL SWVGVVAMLW 
VGGHILLVGM DELGFHLLYG WVHHLETAVH DATGGAGAAL GWVTNTFFSA VLGLLVGAIV 
VAVLHVLPIG RKTAGHGADD GAAGHGAAGH GAGPATPDPA TPDPATPDPG PSERSTPDPD 
EPKG