Gene Ndas_0835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0835
Symbol
ID	9244680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1026738
End bp	1027832
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678785
Protein GI	297559811
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.788787
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0618655
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCA CCGGCCCCGC CTTCGAGGAC GCCGAGCGCC AGGTCGCCCT GGCGGGCGAC 
CCCGTGGAAC TGTTCGGCCC GCTGCCCGAG GACGGCGGCG TGCCCCCGGC GGCCACGGCC 
CGCCACCGCG AGCTGGCCCG CGCGCTGCAC CCCGACACGG CGCCGCCCGG AAGCGGCACC 
GGCCCCTTCG CCCGGCTCTC GGAGCTGTGG GACCTGTACC GGGCGATGGC CGCGGGCGAC 
CTGCGTCTGG ACGACCTCAC CCTGGCCACC GGCGCGCACA CCTACCGGAT CGGCCGGGAG 
CGGCTGGCCC GCGGAGACGT CGCCGACCTC CACCCGGTGC GCTACCGGGC GCCGGAGTGG 
CGCGACGCGG TGCTCAAACT GCCCCGCGCA CCCCGCGACA ACGACCTGCT GGAGGCCGAG 
GCGACCGCGC TGCGCCGCAT CCGGGAGCAC GGCCACGAGC GCTACCGGGC CTTCGTCCCC 
GAACTGGTGG AGTCCTTCAA GCACCGCGAC GCCGCCACCG GCGTGGAGCG GCGGGCCAAC 
GTCCTGGGGC GGCTGCACGG CTTCCACACG CTGGCCGAGG TGCGCCGCGC CCACCCCGAC 
GGCGTCGACC CGCGCGACGC GGCGTGGATG TGGCGGCGGC TGCTGGTCGC CGTCGGCAAC 
GCCGCCCTGG CGGGGGTCGT GCACGGCGCG GTCGTGCCCG AGCACGTGAT GATCCACCCG 
GCCGAGCACG GCCTGGTCCT GGTCGACTGG TGCTACTCGG TGACGGCGCA CGCCCCGCGC 
ACCGCGCCGC ACATCCCGGC GATGGTGCCC GGACGCGCGG ACTTCTACCC GCCCGAGGTG 
GCCGCCCGCC GCCCCGCGCT GGCCCAGACC GACATCCACA TGGCGACCCG GTGCGTGGAG 
TACGTCACCG CGGGCCGCCT GCCCCCGCAG CTGCGTTCCT TCGCGCGCGG CTGCACCCTG 
CCCGCCCCAG AGCGGCGGCC CCGCGACGGG TTCGCCCTGC TCTGCGAACT GGACGACGTG 
CTGGAACGCC TCTACGGGCC GCGCCGGTTC CGCCCCTTCA CCATGCCGGA CCCGGCACCG 
GCCGCCGAGG TCTGA

Protein sequence

MTATGPAFED AERQVALAGD PVELFGPLPE DGGVPPAATA RHRELARALH PDTAPPGSGT 
GPFARLSELW DLYRAMAAGD LRLDDLTLAT GAHTYRIGRE RLARGDVADL HPVRYRAPEW 
RDAVLKLPRA PRDNDLLEAE ATALRRIREH GHERYRAFVP ELVESFKHRD AATGVERRAN 
VLGRLHGFHT LAEVRRAHPD GVDPRDAAWM WRRLLVAVGN AALAGVVHGA VVPEHVMIHP 
AEHGLVLVDW CYSVTAHAPR TAPHIPAMVP GRADFYPPEV AARRPALAQT DIHMATRCVE 
YVTAGRLPPQ LRSFARGCTL PAPERRPRDG FALLCELDDV LERLYGPRRF RPFTMPDPAP 
AAEV