Gene Ndas_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1116
Symbol
ID	9244966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1369603
End bp	1370787
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	75%
IMG OID
Product	mannose-6-phosphate isomerase, class I
Protein accession	YP_003679063
Protein GI	297560089
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0922592
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAGGC TCACCAACCA GGTAAGGCCT TACGCCTGGG GAGCGCGCAC GGCCATCCCG 
CGGCTGCTGG GCGCCGAACC CGACGGCACG CCCCAGGCCG AACTGTGGCT GGGGGCCCAC 
CACGGCGCGC CCAGCACGGC GCACTGCGAG GACGGTCCGC GCCCCCTGCC CGGCCTCATC 
GCCGACAACC CCGACCGCGT CCTGGGGCGG CGCACCGCCG AGCGCTTCGG CGGGCGGCTG 
CCCTTCCTCC TCAAGGTCCT GGCCGCCGAG GCGCCCCTGT CCCTCCAGGT CCACCCCGAC 
GCCGTCCGCG CCCGCGCCGG GTTCGAGGCC GAGGAACGCG CGGGCATCCC CCTGGACGCC 
CCCCACCGCA ACTACCGCGA CCCCCACCAC AAGCCCGAAC TCCTCCTCGC CCTGGAGCCC 
TTCGAGGCGC TGTGCGGCTT CCGCGAACCC GCCGCCGCCC GCGCCGACCT GCGCGGACTC 
ACCTGCGAAC TGGCCGTGGC GCTGCGCGGC GACCTCGCCC TGACCGACGC CGGAACCGCG 
CTGCGCGGCG CCCTCACCCG CCTGCTCACC CTCACCGAGG GCGAGCGCGC CCGGCTGCTG 
GACGACTTCG TGCGCGAGTG GTCGGACTCC GGCCCGCGCG GATCCCACGG CGCCATCGTC 
GCCGACCTGG CCGAGCGCTA CCCGGGCGAC CCCGGCGCGG TGGCCGCCCT GCTGCTCAAC 
CGGGTCACGC TCTGGCCGGG CCAGGCCCTG TTCCTGCCCG CGGGGAACAT GCACGCCTAC 
CTCCAGGGCA CCGCGGTCGA GGTGATGGCC AGCTCCGACA ACGTGCTGCG CGCCGGGCTG 
ACCGGCAAGC ACGTGGACGC GCCCGAACTG CTGGACGTGG TGGACTTCTC GGTGCTGCCC 
ATCCCCTACG CCAGACCCGG GGTCTGCGAG GGGCGCCGGG AGTTCCGCAC GGCCGCCCCG 
GAGTTCGCGC TGCACGAGAT CGGCCCCGGC CGCATCACGG CCCACCTGCC GGGGGAGGGG 
CCGACCGTGC TGCTCGCCCT GCACGGGCAG GTGGAGTTGG TCGCCGAGGT CGGTCAGGGG 
ATGACCCTCC AGCGCGGTGA GTCGGTGTTC GTGCAGGCCG ACAGCGGACC GATCAAGGTC 
GAGGGCCACG GCCACGTCAT CGCCGCCACC GTCGGCGATA TCTGA

Protein sequence

MHRLTNQVRP YAWGARTAIP RLLGAEPDGT PQAELWLGAH HGAPSTAHCE DGPRPLPGLI 
ADNPDRVLGR RTAERFGGRL PFLLKVLAAE APLSLQVHPD AVRARAGFEA EERAGIPLDA 
PHRNYRDPHH KPELLLALEP FEALCGFREP AAARADLRGL TCELAVALRG DLALTDAGTA 
LRGALTRLLT LTEGERARLL DDFVREWSDS GPRGSHGAIV ADLAERYPGD PGAVAALLLN 
RVTLWPGQAL FLPAGNMHAY LQGTAVEVMA SSDNVLRAGL TGKHVDAPEL LDVVDFSVLP 
IPYARPGVCE GRREFRTAAP EFALHEIGPG RITAHLPGEG PTVLLALHGQ VELVAEVGQG 
MTLQRGESVF VQADSGPIKV EGHGHVIAAT VGDI