Gene Ndas_4601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4601
Symbol
ID	9248482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5456573
End bp	5457901
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682493
Protein GI	297563519
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGA CCGTCGAGAA CGAAGGCGGA GGCACGTCGT CGGCGTACGC CTCCAGTACC 
GTCCTCCTGC CCTCTCCGCG GACACCGCGG CCCGGGGCGG GCAGGGACAG GTTCCTGGAC 
GTCATCCGGC TGTTCGTGAT GGCCCTGGTG GTCATGCAGC ACTGGTGGCT GCCGGTCCTC 
GTCCACGAGC CCGGGTCCCT CGAGGCGGGC AGCGTCCTGT CCACCGAGGG CGGCTTCGTG 
CTGACGTGGG TCGTCCAGGT CATGCCGCTG ATCTTCTTCG TCGGGGGCGC GGCCAACCTG 
ATCAGCTGGC GCTCGGCCTC GGGCCGGGGC ATGTCCGCCT CGGACTGGTT CGCGCGCAGA 
CTGCGCAGAC TCGCCTGGCC GGTGGTGCCG CTGGCGGCCC TGTGGATCGT CGCCTCCCAC 
CTGCTGGTCC TGGGCGGCGC ACCGGCCCAG GCCGTCCTGG TGGGCGCCGA GGCCGCGGGC 
ATGGTGCTGT GGTTCCTCGC CGTGTACGTG CTGGTGGTCG TGTCCACCCC GCTGCTGTTC 
CGGGCCCAGG AGCTCTTCGG CTGGTGGGTC CCGATCGCCC TGCTGGCCGC CGCCGCGGCC 
GTGGACCTGA CCCGCTTCTC CACCGGCGCG GACTGGGTCG GCTACCTCAA CGTGGCCTTC 
GTGTGGCTGG GCGTGCACCA GCTGGGGTTC CGCTACGCGA CGGGGACGAT CCGCCTGCGC 
TACGCCGCGG GGATGGTGGC GGGCGGCGCG GCCGCCGCGC TGGCCCTGAC GACGTTCGGC 
CCCTACTCGC TCAACATGAC GGGCGTGTTC GCCACGGAGT CCTCCAACGT GTCCCCGCCC 
ACCCTGGTGC TCGCCGCCAT GGGCGCGCTG CAGATCGGCG TCGCGGTGCT GCTGCGCGAG 
CGGATCAGCG CCTGGTCCGA GCGCCCGGGC CCGGCGCGTC TGCTGGACCG GATCTGCCCG 
CAGCTGATGA CGGTCTACCT GTGGCACATG CTGCCGCTCA GCGTGGTGGC GGGCGTGCTG 
GTGTTCGGCC TGGGGATCGA CACCCCCGAG CCGCTGACGG GCCTGTGGGT GTTGTGGGGC 
GTGCTGGGGC TGGTGGTCCT GGTGCCCCTG ATCGTGCCGC TGGCGCACTG GGCGGTGCGG 
TTCGAGAACC CGCCGAAGGT GCTGAGCGGT TCCCCGGGCA TGGTCCGCGT CCTGGCCGCC 
GCGGCGCTGG TCGGCGGCGG GATGCTGCTG CTGACGGTGT CCGGCCTGGG GCTCGGCATG 
GGACCGGTGC TCGGACTGCT CGCGGTGCTG TCGGGCGTGG TGCTGACTCG GGCTCCCCGG 
AGGAGCTGA

Protein sequence

MTVTVENEGG GTSSAYASST VLLPSPRTPR PGAGRDRFLD VIRLFVMALV VMQHWWLPVL 
VHEPGSLEAG SVLSTEGGFV LTWVVQVMPL IFFVGGAANL ISWRSASGRG MSASDWFARR 
LRRLAWPVVP LAALWIVASH LLVLGGAPAQ AVLVGAEAAG MVLWFLAVYV LVVVSTPLLF 
RAQELFGWWV PIALLAAAAA VDLTRFSTGA DWVGYLNVAF VWLGVHQLGF RYATGTIRLR 
YAAGMVAGGA AAALALTTFG PYSLNMTGVF ATESSNVSPP TLVLAAMGAL QIGVAVLLRE 
RISAWSERPG PARLLDRICP QLMTVYLWHM LPLSVVAGVL VFGLGIDTPE PLTGLWVLWG 
VLGLVVLVPL IVPLAHWAVR FENPPKVLSG SPGMVRVLAA AALVGGGMLL LTVSGLGLGM 
GPVLGLLAVL SGVVLTRAPR RS