Gene Ndas_1368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1368
Symbol
ID	9245218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1676889
End bp	1678169
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	73%
IMG OID
Product	Cellulase
Protein accession	YP_003679306
Protein GI	297560332
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.828638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCAAC CCCCCGCCCC CGCCCGACGG CGTCCCGCCC CCGTCCGCGC CGCCCTCGCC 
GGCGCGCTCC TGCTCGCACC CCTCGCGCTC GTCGCCGCGC AGGGCACGGC CGCGGCCGCC 
CCCGCCTCCT CGGCGGCCGA GGCGCCGGTC CGGGCCGCCG CCAGCCCCGT CGAGACCCAC 
GGCCAGCTGC GGGTCTGCGG CCTCAAACTC TGCGACGAGA GCGGAGAGAC TGTCCAGCTC 
ACCGGGATGA GCTCCCACGG CCTGCAGTGG TACAGCGACT GCCTCACCGA CGGCTCCCTG 
GACGCGCTCG CCCACGACTG GAACGCCGAC GTCCTGCGCG TGTCCATGTA CATCCAGGAG 
GGCGGCTACG AGACCGACCC GCGCGGCTTC ACCGACCGGG TCCACGAACT GATCGAGGAG 
GGCACCGCAC GCGGCATGTA CGTCATCGTC GACTGGCACA TGCTCACGCC CGGCGACCCG 
AACCACAACA CCGACATGGC GCGCACCTTC TTCTCCGAGA TCGCCTCCGT CCACGCCGGC 
AAGGACAACG TCCTGTACGA GATCGCCAAC GAGCCCCACG GGGTCTCCTG GGACGCGATC 
CGCGGCTACG CGGAGGAGAT CATCCCGGTC GTGCGCGCCG AGGACCCCGA GGCCGTCGTG 
CTCGTCGGCA CCCGCGGCTG GTCCTCCCTC GGCCTGTCCG AGGGCTCCGA CCACACCGAG 
ATCACCGCCG ACCCGGTGGA CGCCGACAAC ATCATGTACG TCTTCCACTT CTACGCCGCC 
ACGCACGGCG ACTTCCACCG GGAGGGCCTG CGGGCCGCGG CGCGGGACCT GCCGCTGTTC 
GTCACCGAGT TCGGCACCCA GGAGGCCACC GGCGACGGGC CCAACGACTT CGCATCGGCC 
CAGGCCTACC TCGACCTCCT GGCCGAGGAG CAGATCAGCT GGGTGAACTG GAACTTCTCC 
GACGACTTCC GCTCCGGCGC GGTGTTCGAG ACGGGCACCT GCGCCGCCGA CGGCCCCTGG 
ACCGGAACCG AGTCGCTCAA GCCCGCGGGG GAGTGGATCC GCGACCGCAT CCGCGAGAGC 
GGGGTCGTCC CGACCGACCC CACCGATCCC ACCGACCCGG ACGCGTGCGA GACCCCGGCC 
TGGTCCTCGG GAGAGGTGTA CACCGGCGGC GACCAGGTCA GCCACGGCGG GCGCCTGTAC 
CGGGCCCAGT GGTGGACACG GGGGGAGGAG CCCGGGACCA CGGGTGAGTG GGGCGTCTGG 
CGGGACCTCG GCGCCTGCTG A

Protein sequence

MAQPPAPARR RPAPVRAALA GALLLAPLAL VAAQGTAAAA PASSAAEAPV RAAASPVETH 
GQLRVCGLKL CDESGETVQL TGMSSHGLQW YSDCLTDGSL DALAHDWNAD VLRVSMYIQE 
GGYETDPRGF TDRVHELIEE GTARGMYVIV DWHMLTPGDP NHNTDMARTF FSEIASVHAG 
KDNVLYEIAN EPHGVSWDAI RGYAEEIIPV VRAEDPEAVV LVGTRGWSSL GLSEGSDHTE 
ITADPVDADN IMYVFHFYAA THGDFHREGL RAAARDLPLF VTEFGTQEAT GDGPNDFASA 
QAYLDLLAEE QISWVNWNFS DDFRSGAVFE TGTCAADGPW TGTESLKPAG EWIRDRIRES 
GVVPTDPTDP TDPDACETPA WSSGEVYTGG DQVSHGGRLY RAQWWTRGEE PGTTGEWGVW 
RDLGAC