Gene Ndas_4605 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4605
Symbol
ID	9248486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5462365
End bp	5464191
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682497
Protein GI	297563523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.269217
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.930021
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTGC TCGACCAGTA CGGCACCGTG GGCGGTGCCG TGCTCCTGTC CCCCGGCCTC 
CTGGTCACGT GCGCGCACGT CGTCAACGCC GCGCTCGGCC TCCACGGGGA GAAGGAGGAG 
CACCCGGGCC CGCTCGCCAC CGTGCGCCTG CGGTCCTTCG ACGACCGGGT GTGGGAGGCC 
TCCGTCGACA CCCGGCTGTG GTCGGCGGGC CCCGACAGCC GCGACCTGGC CGTGCTGAGG 
CTGCGGGACG CGGGCCCCGA CACCTCCTTC CCCGTGCTGC GGGAGTGCGC GAGCCTGGAG 
CCGCAGCAGC CCCTGTACAC GGCGGGCTAC CCGGAGGGCA TGCGTTCCCT CCAGGCCCCG 
CTCGTCTGCC AGGGGCCCGG CGGGCCCACC GGGGTCACCC ACCAGGTCGA GACCCCCACC 
TCACAGCCGG TGCGGATCAC CGGCGGGTTC AGCGGCTGCG CCGTGCGCAC CGGGACGGGC 
GAGCTGGTGG GGATCATGCA GAAGACCCAC CACTACGTCT GGAACGACCC CGACCGGCCC 
TCCGGCATCG CGTTCATCCT CCCGGTGGAG GAGCTCGTCG GCGAGCGCGA CGACGGCGAG 
GTCGTCTCCG CGCAGCGCCT GGCCGACGAG TCCCTGTGCG GCAGGGAGGC CTACGACAGG 
CTGCACGACC TGCTGGACTC GGTCCCCCTG GACGCTGTCC CGCCGGAGGA CCTGCTGAGC 
CCCGCCGAGG CGCGCAAGGC CAGGCGGCAC GGCGCGGGCA CGACCGCCTG GCGGGTCCTC 
ACCGCGCTGT GGGACCTGGT CCCGCCCGTC GGCGAGCCGC CGCCCCGGGT CGCCTGGGTG 
CACCACGTCT ACCAGGAGAT CCGGCACCAG CGGCCGCTCC CGCCCGCGGT GTGGTCCTGG 
ATCCGGCAGG AGGCCGGGCC GATGGGGCGC GACTGGGAGG AGGCCCTGAC CCGTGACCGG 
GACCGGCGGC TGCTCCGGCG CAGGGAGCCG GACGCGCCCG CGGCGCCCTC CGGCCACCGC 
GACGAGCGTC CGCCCGACAC GGTGGTGCTC TTCGAGCTGG AGCCGGTGAC CGGCGGCTAC 
CGGCTCTCGC ACCGGATCGC CCACCGGGGC GAGAGGGACG ATCCGCTGCC CCAGGGCACG 
AGGCTGGTCG GCGAACCGCA GATCTGCGAC GAGATCGCCG ACCTCATGGG CGAGGCCACC 
ATGCAGAGGC TGGTCACGCC CAACGAGGAG TCGCTGCGGC TGCGCGTCCT GCTGCCCAGG 
GACCTGCTGC ACCTGAACCC GGGCCAGGCC AGCCCCCACC GCGACCTGCT GGAGTACGCG 
CCGCCGCTGT GCACCATGTA CGAGATCGTG TACCACGTCC GCGAGCGGGT GCGGTTACCG 
CACTACCTGG GGGTTCCCCC CGACAGGTGG CGCCTGCGCT GCGAACGGCA GACGGCCAGC 
CCCCTGGTGG AGGACCGCAA CGTGCTCGCC TCCTGGAAAC AGGAGGTGAG CGAGGTGGCG 
ATCGCCCTCT CCGACCAGAA CGTGACCGTG TGCGTCACCG ACTCCGACAA CAGCGATGTG 
GAGCACGTCT ACGACTCCGC CCTCTACTGG GGAATTCCCA CCATCATCAG GGGGCCCAGA 
AAGGCGGTGA CCGCCTTCCT TGAGGAACTC CTGGACCGGG AACCCGATTC GCGGGTGCGC 
ATCTCCGGAC TCGCCCGCCA CCTGCGTGAC AGCGCGAGAA GGAGTTCGCA GGCCAGGGAG 
ATCGCGATCA TTCATGACAT CTTCGGCGAC GCCCTCCTCC AGGAGACGCC CGGGGAGCCC 
GCGGGCCCTG AGAGACCGGG CGTCTGA

Protein sequence

MRVLDQYGTV GGAVLLSPGL LVTCAHVVNA ALGLHGEKEE HPGPLATVRL RSFDDRVWEA 
SVDTRLWSAG PDSRDLAVLR LRDAGPDTSF PVLRECASLE PQQPLYTAGY PEGMRSLQAP 
LVCQGPGGPT GVTHQVETPT SQPVRITGGF SGCAVRTGTG ELVGIMQKTH HYVWNDPDRP 
SGIAFILPVE ELVGERDDGE VVSAQRLADE SLCGREAYDR LHDLLDSVPL DAVPPEDLLS 
PAEARKARRH GAGTTAWRVL TALWDLVPPV GEPPPRVAWV HHVYQEIRHQ RPLPPAVWSW 
IRQEAGPMGR DWEEALTRDR DRRLLRRREP DAPAAPSGHR DERPPDTVVL FELEPVTGGY 
RLSHRIAHRG ERDDPLPQGT RLVGEPQICD EIADLMGEAT MQRLVTPNEE SLRLRVLLPR 
DLLHLNPGQA SPHRDLLEYA PPLCTMYEIV YHVRERVRLP HYLGVPPDRW RLRCERQTAS 
PLVEDRNVLA SWKQEVSEVA IALSDQNVTV CVTDSDNSDV EHVYDSALYW GIPTIIRGPR 
KAVTAFLEEL LDREPDSRVR ISGLARHLRD SARRSSQARE IAIIHDIFGD ALLQETPGEP 
AGPERPGV