Gene Namu_4395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4395
Symbol
ID	8450021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4877012
End bp	4878025
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	72%
IMG OID	645043442
Product	hypothetical protein
Protein accession	YP_003203671
Protein GI	258654515
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1387] Histidinol phosphatase and related hydrolases of the PHP family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCCGA TCGCCGCCCT GCGCCGCATC GGCTTCCTGC TGGAGCGGGA GCGGGCCCCC 
ACCTACCGGG TCCGGGCGTT TCGTAACGCG GCCCTGACGC TGGCCGGGTT GCGTCCGGAC 
GAGCTGGACC GGCGCGCCGC GGACGGCACG CTCACCGAGC TGCCGGGCAT CGGCAAGACC 
ACCGGGACGG TGATCGGGCA GGCCCTGGCC GGGCAGGTGC CGCAGTATCT GGCCGATCTG 
GAGGCCGGGG TCCAACCGCT GACCACCGGG GGTGAGGGGA TCCGCGCGCA GCTGCGCGGC 
GACCTGCATG CGCACAGCGA CTGGAGCGAC GGGGGCAGCC CGATCCAGGA AATGACGGTC 
ACCGCTCAGG AGCTGGGCCA CGAGTACCAG GCGCTGACCG ATCACTCGCC GCGGCTCAAG 
GTGGCCAACG GGTTGTCGGC CGATCGGCTG CGCCGGCAAC TGCGCATCGT GGCCACCCTC 
AACGAGCACC TCGGTGACTT CCGGCTGCTC TCGGGCATCG AGTGCGACAT CAACGATGAC 
GGCACCCTGG ACCAGAGCGA TCAGCTGCTC GGGCGGGTCG ACGTGGTGGT CGCCTCGGTG 
CATTCCAAGC TGCGGTCGGA TTCGGGGTCG ATGACCCGGC GGATGCTGCG GGCGATCGCC 
GACCCGCACA CCGACATCCT GGGGCACTGC ACCGGGCGGC TGGTCACCGG CGGTCGCGGC 
ACCCGGCCGC CCAGCCAGTT CGACGCGGAT CGGGTGTTCG CGGCCTGCGC CGAGCACCAG 
GTGGCCGTGG AGATCAACAG CCGGCCGGAG CGGCTCGACC CGCCGATGCC CCTGCTGCGG 
CAGGCGGTGG CCGCGGGCTG CCTGTTCAGC ATCGACACCG ACGCGCACGC CCCGGGCCAG 
CTGGACTGGC AGGCCTACGG CTGCGCCCGG GCCGAGGCGG CGCAGGTGCC GGTGGACCGG 
ATCGTCAACA CCTGGCCGCT GGATCGGCTG CTGGACTGGA CCAACCGCGG CTGA

Protein sequence

MDPIAALRRI GFLLERERAP TYRVRAFRNA ALTLAGLRPD ELDRRAADGT LTELPGIGKT 
TGTVIGQALA GQVPQYLADL EAGVQPLTTG GEGIRAQLRG DLHAHSDWSD GGSPIQEMTV 
TAQELGHEYQ ALTDHSPRLK VANGLSADRL RRQLRIVATL NEHLGDFRLL SGIECDINDD 
GTLDQSDQLL GRVDVVVASV HSKLRSDSGS MTRRMLRAIA DPHTDILGHC TGRLVTGGRG 
TRPPSQFDAD RVFAACAEHQ VAVEINSRPE RLDPPMPLLR QAVAAGCLFS IDTDAHAPGQ 
LDWQAYGCAR AEAAQVPVDR IVNTWPLDRL LDWTNRG