Gene Namu_2473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2473
Symbol
ID	8448084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2729176
End bp	2730210
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	73%
IMG OID	645041586
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003201830
Protein GI	258652674
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000066055
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0147407
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGGG CGGTGGCCGA GCCGAACGAC GACGTACGGC TGGAAACGGC CGCGATTCCC 
ACCCCGGCGC CGGGCGAGGT CCTCGTCCGC AGCACGCTGG TGGGGATCTG CGGATCCGAC 
ACCCATGCCC TGGCCGGCCA CCACCCCTTC CTGACCAGCC GCTACCTGCC CGGCCACGAG 
GCAACCGGCA CCGTCGTCGC GCTCGGCGAC GGCATCGAGT CGCTGTTCGT CGGGCAGCGG 
GTCCTGCTCA AGCCCAACGT CGCCTGCGGC GACTGCGCGA ACTGCGCCGC CGGCCGGTCC 
AATGCCTGTG CCCAGCTGTC CTGGATCGGC TGTGACCCCT CGCTGCATTG GGCCGGCGCG 
ATGGCCGACT ACTTCGTCGC GCCGGAGCGG AACCTGTTCC CGGTGCCGGA CGGGGTCGAC 
GACCGCACCG CGGTCCTCGT CGAATGCCTG GCCACACCCG TGCATGCGGT GCGCATCAGC 
GGCGACCTGA CCGGCGCCCG GGTCGTGATC CTGGGCGCCG GCACCATCGG CGTGCTGTGT 
GTCGTCGCCG CCCGGCACGC CGGTGCCGGC GCCATGGTGG TCACCGACCT GGACCCGGGC 
AAGTTGGACC GGGCCAGGCG CGTCGGCGCC CACGGCGCGG TGCCGGCCGA CGACCCGGCG 
GTGAACGAAC GGGTCCTGGC CCAGTTGGGT GGCCCGGCGG ACGTGGTGCT GGACTGCGTG 
ACCAACGAAC GATCGTTGAA CCAGGCCGTG GCCCTGCTCC GGCGGGCCGG CACCCTGGCC 
GTGGTCGGGG TGCCGCCGCG GGACGCGACG CTGCCCATGC CGCTGATCCA GGACTGGGAG 
ATTCGCGTTC AGGGATGCGC CGCCTACACC GAGGCCGATA TCCGCACGGC CCTGCAGATC 
GCCACCGACG CAGGCCTGCC GACCGACGAG ATCGTTGCGG CCACCTACGG TTTGGACGAG 
GTGGCGAGCG CCTTCGGGCA GGCCGCGGCC GACAGCTCCG GCAAGGTGCT CATCGCCCCG 
CCCCGGCGCG GTTGA

Protein sequence

MRRAVAEPND DVRLETAAIP TPAPGEVLVR STLVGICGSD THALAGHHPF LTSRYLPGHE 
ATGTVVALGD GIESLFVGQR VLLKPNVACG DCANCAAGRS NACAQLSWIG CDPSLHWAGA 
MADYFVAPER NLFPVPDGVD DRTAVLVECL ATPVHAVRIS GDLTGARVVI LGAGTIGVLC 
VVAARHAGAG AMVVTDLDPG KLDRARRVGA HGAVPADDPA VNERVLAQLG GPADVVLDCV 
TNERSLNQAV ALLRRAGTLA VVGVPPRDAT LPMPLIQDWE IRVQGCAAYT EADIRTALQI 
ATDAGLPTDE IVAATYGLDE VASAFGQAAA DSSGKVLIAP PRRG