Gene Ndas_2942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2942
Symbol
ID	9246794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3515766
End bp	3517190
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	68%
IMG OID
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_003680858
Protein GI	297561884
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0858983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTGG TCGTCGGTGG TGCCGGTGCC GTGACGGTGC CGACGCCCGC CGCGGCGGCG 
ACGGTGGACA CCAACGCGTG GTACGTGCTG GTGAACCGCG ACAGCGGCAA GGCGTTGGAC 
GTGTACAACC TGGCCACCGG TGACGGCGCG CGGATCACCC AGTGGACACG GAACGACCAG 
TACCAGCAGC AGTGGCGGTT CGTCGACTCC GGCAACGGTT ACTACCGGTT GCGGTCACGG 
CATTCGGGCA GGGTGCTGGA CGTCCACAAC TGGTCGACCG CCAACGGCGG CGGTATCGTC 
CAGTGGACCG ACCACGACCA GGCCAACCAG CAGTTCCGGC TGGAGGACTC GCCCGGCGGC 
CACATCCGTC TGGTCAACCG GCACAGCGGC AAGGCCGTGG AGGTCCAGGG CGCCTCGACC 
GCGGACGGTG CCAACGTCGT GCAGTACGAC GACTGGGGCG GCGGCAACCA GCAGTGGCGG 
CTCGTCCGCG TCGACGGCGC GGGACCGGGC GAAACGTGCG CCCTTCCGTC GAGTTACACC 
TGGACGTCGA CCGGGCCGCT GGCGCAGCCG AGGCCGGGGT GGGCCTCGCT CAAGGACTTC 
ACCCACGCCC CCTACAACGG CCAGCACCTC GTCTACGCGA CGACCCACGA CACCGGGACG 
TCATGGGGCT CGATGAACTT CGGCCTCTTC TCGGACTGGT CCCAGATGGG CTCGGCCAGC 
CAGAACCCGA TGCCCTTCTC AGCCGTCGCG CCGACGCTCT TCTACTTCGC CCCCAGGGAC 
GTCTGGGTGC TCGCCTACCA GTGGGCCGGT CCCGCCTTCT CCTACCGGAC ATCGACCAAC 
CCCGTCAACG TGAACAGTTG GTCGGCTCCG CAGACGCTCT TCTCCGGAAG CATCGGTGAC 
TCCTCCACGG GGCCCATCGA CCAGGCGCTC ATCGGCGACA GCACGCACAT GTACCTGTTC 
TTCGCCGGGG ACAACGGCCG CATCTACCGG GCCGGCATGC CCATCGGCGA CTTCCCGGGC 
AGCTTCGGCT CGACCTCGAC GGTCGTCATG TCCGACAGCA CCAACAACCT GTTCGAAGCG 
GTTCAGGTCT ACAGGGTCGA GGGCGAGAAC CGGTACCTCA TGATCGTCGA GGCCATCGGC 
GCGCAGGGGC ACCGCTACTT CCGCTCGTTC ACGGCCACCA GTCTGGACGG CACGTGGACA 
CCCCAGGCCG CGACCGAGGG CAACCCCTTC GCGGGTCGGG CCAACAGCGG CGCCACCTGG 
ACCAACGACA TCAGTCACGG TGAGCTCATC CGCACCAACC CCGACCAGAC CATGACCGTC 
GACGCCTGCG ACATGCGGTT CCTCTACCAG GGGCGCTCCC CCGGCTCCGG CGGCGACTAC 
GGCCTCCTGC CCTACCGGCC CGCAGTGCTG ACGCTGCGGC GCTGA

Protein sequence

MALVVGGAGA VTVPTPAAAA TVDTNAWYVL VNRDSGKALD VYNLATGDGA RITQWTRNDQ 
YQQQWRFVDS GNGYYRLRSR HSGRVLDVHN WSTANGGGIV QWTDHDQANQ QFRLEDSPGG 
HIRLVNRHSG KAVEVQGAST ADGANVVQYD DWGGGNQQWR LVRVDGAGPG ETCALPSSYT 
WTSTGPLAQP RPGWASLKDF THAPYNGQHL VYATTHDTGT SWGSMNFGLF SDWSQMGSAS 
QNPMPFSAVA PTLFYFAPRD VWVLAYQWAG PAFSYRTSTN PVNVNSWSAP QTLFSGSIGD 
SSTGPIDQAL IGDSTHMYLF FAGDNGRIYR AGMPIGDFPG SFGSTSTVVM SDSTNNLFEA 
VQVYRVEGEN RYLMIVEAIG AQGHRYFRSF TATSLDGTWT PQAATEGNPF AGRANSGATW 
TNDISHGELI RTNPDQTMTV DACDMRFLYQ GRSPGSGGDY GLLPYRPAVL TLRR