Gene Namu_1801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1801
Symbol
ID	8447406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1976258
End bp	1977379
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	75%
IMG OID	645040930
Product	UspA domain protein
Protein accession	YP_003201180
Protein GI	258652024
COG category	[T] Signal transduction mechanisms
COG ID	[COG0589] Universal stress protein UspA and related nucleotide-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.00612057
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.112863
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCGC TCGAGGAATC CCGGGCCGTC CACGAGGCGC AGCGTGGGGT GGTCACCCGA 
GCCGGTGGGG TGACCAGCCA TGAGCATGCG CTGCAGCAGT ACCTGGTCGC CGCGCAGTAC 
GGCGTGACCC GCGGCGATCG CCCGCAGCCG GACGCCGCCG CCCCGCCCGC GGCACCGCCG 
GCCGCCCAGA CCGTCGCCGA CGAGAGTTCG GACCGGACCG ACCGGCGGTC CGAGTACCCG 
GCGGGTGCCG TGGTGGTCGG CGTCGACGAC TCGGCCGGCG CCCGGGCGGC GGCTGCGTGG 
GGCGCCGACG AGGCGGTGCG GCGACACGCC CCGCTGGTGC TCGTGCACGC CTACCGGTTG 
CCGGCGACCG GCGGTTTCCC CGGCTACAAC CCGGTCCCGG ACGATCTGCT CGAACAGCTG 
CGGGCCGCGG GCGACCACCT GCTCCGGCGC ATCGGCGAGG AGGTGGCGGG CCGCCACCCG 
GACCTGCCGG TCGTCCGCTC GTTGGTCCAC GGCCGCGCCG AGGTGGCGTT GCGGGAGGCC 
TCCGGGCAGG CGCGATTGAC GGTCGTCGGC AACGCGCCGT CGTCCCGGGT GGCCGGTGCG 
TTGCTCGGTT CGGTGGCCCT GGCCGTGACG TCGTCGAATC CGGTTCCCGT CGCGGTGGTC 
CATGCCGGGC ACCAGGTGGC CGACGGACCG ATCGTCGTCG GCGTCGACGG GTCCCCGCTC 
AGCGAGGCGG CGGTGGCGTT CGCGTTCGAC GAGGCCGCCC TGCGCGGCGT CGAACTGGTT 
GCCGTCCATG CCTGGAACGA TGTCTACCTG GACTCCCGAC GGTTGGAGCC GCTGCTGATC 
GATCCGCAGA CCCTGCTGGA GCAGGAGCGG GCTCTGCTCG GTGAACGCCT CGCCGGGTGG 
GGGGAGAAGT ACCCGGACGT CCCGGTGCGG CAGGTCCTGC TGCATCAGCG ACCCGTGCAG 
GCGTTGCTGG GCTACGCCGA CTCCGCGGGC GCGATGGTCG TGGGCAGCCA CGGCCGCGGC 
GGGTTCGCCG GGATGCTGCT CGGGTCCACC GGACACGCGT TGGCCACCCA CGGCCAGTGC 
CCGGTGATCG TCGTCCGGAA CGCCGTCGAC CGGGCCCGCT GA

Protein sequence

MNPLEESRAV HEAQRGVVTR AGGVTSHEHA LQQYLVAAQY GVTRGDRPQP DAAAPPAAPP 
AAQTVADESS DRTDRRSEYP AGAVVVGVDD SAGARAAAAW GADEAVRRHA PLVLVHAYRL 
PATGGFPGYN PVPDDLLEQL RAAGDHLLRR IGEEVAGRHP DLPVVRSLVH GRAEVALREA 
SGQARLTVVG NAPSSRVAGA LLGSVALAVT SSNPVPVAVV HAGHQVADGP IVVGVDGSPL 
SEAAVAFAFD EAALRGVELV AVHAWNDVYL DSRRLEPLLI DPQTLLEQER ALLGERLAGW 
GEKYPDVPVR QVLLHQRPVQ ALLGYADSAG AMVVGSHGRG GFAGMLLGST GHALATHGQC 
PVIVVRNAVD RAR