Gene Namu_4201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4201
Symbol
ID	8449827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4642208
End bp	4643212
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	71%
IMG OID	645043250
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003203479
Protein GI	258654323
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.245783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCC TGGTCACCGG CGCGGCCGGG TTCATCGGGT CCACCCTCGT CGACCGGCTG 
CTCGCCGACG GTCAGCGGGT ACTCGCGGTG GACGACTTCA GCCGGGGTCG AATGGAGAAT 
CTCAGATTCG CCCAGGCGGC CGGCGGGGAA CGGCTGGCCA CCATCCGCCT GGACATCGGC 
GATCCACGGT TGGCCGAGGT GATGGCGGCA GCTCGACCCG AGGTCGTCTA TCACCTGGCC 
GCCCAGGTCG ATGTCCGCTG CAGCGTCGAC GACCCGGTCA CCGACGCCCG GATCAACGTC 
CTCGGCACGA TCGCGGTGGC CGATGCGGCC CGCGCCGCCG GCGTCCGCAA GATCGTCTTC 
ACCTCGTCCG GCGGATCGAT CTACGGCGTA CCCGATCGCC TTCCGGTGGA TGAGGGAGCG 
GCGCTGCAGC CCCGATCGCC GTATGCCGTG GCCAAGGTGG CCGGCGAGCT GTACCTCAAC 
GCCTATTCCG GTCTGCACGG CGTGCAGTGC ACGCACCTGG CCCTGGCCAA CGTGTACGGG 
CCGCGACAGG ACCCGTCCGG GGAGGCCGGG GTGGTCGCGA TCTTCACTCA CGCGCTGTTG 
ACCGGCCGGC CGACCCGTCT GTTCGGGGAC GGCTCCAATA CCCGCGACTA CGTCTTCGTC 
GAGGATGTCG CCGCTGCGCT GCAGGCCGCC GCGGCGCCCG GCTGGGACCG GGTTCGTTTC 
AACATCGGCA CCGGCCGCCA GACCTCCGAT CGCGAGCTGC ACTCGGTCCT GGCGGGCCTG 
GCCGGCGCAC CTGACGAGCC CACCCACGCA CCGGCCCGAC CGGGCGACCT GCACCATTCC 
GCAGTCGACT CCACCCGGGC CCACCGCGAC CTGGGATGGA CGCCCGAGCA CACGCTGGCG 
CAGGGGCTGC GCCGGACCGT CAACGATGCC CGGACGCAGC TCGAGCTCGC AGGTTCAGCG 
CCCGCCCGTC CTCCGCACCC CGATCAGCCG GCGGCGCGCC TATAG

Protein sequence

MTALVTGAAG FIGSTLVDRL LADGQRVLAV DDFSRGRMEN LRFAQAAGGE RLATIRLDIG 
DPRLAEVMAA ARPEVVYHLA AQVDVRCSVD DPVTDARINV LGTIAVADAA RAAGVRKIVF 
TSSGGSIYGV PDRLPVDEGA ALQPRSPYAV AKVAGELYLN AYSGLHGVQC THLALANVYG 
PRQDPSGEAG VVAIFTHALL TGRPTRLFGD GSNTRDYVFV EDVAAALQAA AAPGWDRVRF 
NIGTGRQTSD RELHSVLAGL AGAPDEPTHA PARPGDLHHS AVDSTRAHRD LGWTPEHTLA 
QGLRRTVNDA RTQLELAGSA PARPPHPDQP AARL