Gene Ndas_3079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3079
Symbol
ID	9246935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3681640
End bp	3683781
Gene Length	2142 bp
Protein Length	713 aa
Translation table	11
GC content	67%
IMG OID
Product	hypothetical protein
Protein accession	YP_003680994
Protein GI	297562020
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.411817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGTGG GCTCCCCCCT ATTGGTGACG CTCTCCGAGA TCGCCGAGTA CGCCCAGGTG 
CGCCGACCCA GCGTGAGCAA CTGGCGTCGA CGCCATACCG ACTTTCCTCG TCCTGTGAGC 
GCTTCCTCGA ACGTACCGCT GTTCGACTCC GACGAGGTAG CCGCATGGCT GGACCGGCGT 
CCAGTCCACA AGGCCGCTTC TCCTGTGCAC ACAACCGAAG ACGAGGAGAA CTCCCCGGCG 
ACCTATGGCG AGGTGTATCG GACGGGCATC CTACTCTCCG CGGTCACCTC GCACCGTGAA 
CTACCTCCCG AAGAGCTCCT GATCGCGGCC CTCCGCGTTG TCTGCGCCTA CCGTTCCGCA 
TCCGAGGCGA CTCCGGTCAC CGTTCAGGAA TTCCCACCCG ATCCAGATCT GCACGCCTCG 
GTCCATGCCC TGGTGGATGT ACTCGGGCGA GCGGCGGCCA CAGAGCGCCT CATGGACCTG 
GCCTCACGGT TGGAGCTCTC CTGGGCACCC GAGCAGGCAC CCCCGGCCGT GTGCACGCTC 
GTCAGCAGGC TCCACCAAGT CCTCGCCGAC GGAGCGGGGG ACGCCTCCAT CGTTGATCTG 
TCCGCCGGAG CGGGTGCCGG GCTCCTGGCG TTACTCAGCA CTGGAGCACC GCGTTCGGCC 
ACCGCGGTGG TGAACGAGGT ATCGCTCGGC GAAATCCTCT CCCTCCGTCT CCGAGCCCAT 
GGAATACCGG CCGTGGATAT TCAGGTCAGC GCACCGATCA CCCACGACTC CGACGTGGTG 
CTCGCCTATC CGCCCTTCGT TCCCGGTGAG CGGGCCGACC ACGCTGACCA CCCACTCCTG 
TGGGCGGAAC AGGCCGTGAG CATGCTTCAG ACCGACGGAC TCGCTTACGT CGTCGTCCCT 
GACTGGACAC TCACTCACAC AGGACGGGGC AGCTCCACTC CTCCTGTGGC CGCCTCCCGG 
GAACGGCTGC TCCGCAACCG GTGTATCCGA GCGGTGGTCC AACTGCCCCG CCGTATCCAC 
CCCAGCCGCC CCGGCGCGGA GCTGGTGCTC CTGGTCCTGA CCCCGCGAGG CGAGGGGGGC 
AGCACCGTGA CGCTGTGCGA CGCCGATCGA ATCGCGCGAA CGCAGGGACG CCATACGTCC 
GCGAGGACCA ACGGTCAGGG GTGGATTGCC CCATGGGCGG AGGAAACCGT ACTCTCGATC 
GCCGAAGCCC ACCGACGCCC AGGCTCCGAG GTATGCCGTT CCTTCACACC AGCCGACCTC 
ATGGATCGCC ACCGTGTCCT CCCACTGCTC CCTTCCCAGC GGCTCACACC CTCCTCCCAA 
CCACAGGAAC ACATCACTGA GGCCGGAGAA AGCCGACGGG ACGCGACTGT TGCCCTCGCG 
GGGACATCAG GGCCGACGCT GGACTGGCTC AACCGGCTCA GGACTCCGCC CCGGCGAACT 
CCGACGCGGT ACGAGCGGCT GGGTTCCCTA CTCACCGGTG GGCAGCTACG TCTGGTCCAA 
GGCCACCGGA TCAGGACGGA CGACCTCGGT GACGAGGGCC AGACCGTCTA TGGGCGTGAG 
GAGATGCTCG GTGAGATCCC GGTCGGGCAG CGCCGGATCA GCCCGCTCGT CCTCGCCGAG 
TACCCGTCCG CGCTGGTCAC GGAGCCCGGA GATGTGATCC TACTCTTCGA CGAACGGCTG 
CGCACCGTCG TCGACCAGGC AGGGGGGAGC GTCCTGTTGT TCCCCGTACA AGCCTTGCGG 
ATCAGGGCCT ACGGAGACCT GCGCAAACCC ATGTCGATGG AACTCGGGCG AGCGTCCTCG 
GTGCGGATTT GGCCCCACCA ACTGGCGGCC GTGCTCTCCG CCGGGCGCAA CGCCCGGCGC 
GGTCGTGGCT CCCTCGTGCG CAGAGCCGAC CTCGAAGGCG TGGAGATCCC CGTTATGTCA 
CCGACGGAGG CCAAGCTCTT CGATGACGCC ATGCGTGAGC ACGCGGCCGA GGTCGAGCGC 
CTCCGCCGCC AGCTCACAGC AATGGAGGAC CTCGGCGCCG TGCTGGCCTC CGGAGTCGCG 
GACGGTGCCC TGTCCGTCCA GCTCCACCCC CGTGCGCGTC GACCCGACTC GACCAACGTG 
CCTTTCGAGG GCACCGCCTC AGACTTCGAC GACGACCACT AG

Protein sequence

MKVGSPLLVT LSEIAEYAQV RRPSVSNWRR RHTDFPRPVS ASSNVPLFDS DEVAAWLDRR 
PVHKAASPVH TTEDEENSPA TYGEVYRTGI LLSAVTSHRE LPPEELLIAA LRVVCAYRSA 
SEATPVTVQE FPPDPDLHAS VHALVDVLGR AAATERLMDL ASRLELSWAP EQAPPAVCTL 
VSRLHQVLAD GAGDASIVDL SAGAGAGLLA LLSTGAPRSA TAVVNEVSLG EILSLRLRAH 
GIPAVDIQVS APITHDSDVV LAYPPFVPGE RADHADHPLL WAEQAVSMLQ TDGLAYVVVP 
DWTLTHTGRG SSTPPVAASR ERLLRNRCIR AVVQLPRRIH PSRPGAELVL LVLTPRGEGG 
STVTLCDADR IARTQGRHTS ARTNGQGWIA PWAEETVLSI AEAHRRPGSE VCRSFTPADL 
MDRHRVLPLL PSQRLTPSSQ PQEHITEAGE SRRDATVALA GTSGPTLDWL NRLRTPPRRT 
PTRYERLGSL LTGGQLRLVQ GHRIRTDDLG DEGQTVYGRE EMLGEIPVGQ RRISPLVLAE 
YPSALVTEPG DVILLFDERL RTVVDQAGGS VLLFPVQALR IRAYGDLRKP MSMELGRASS 
VRIWPHQLAA VLSAGRNARR GRGSLVRRAD LEGVEIPVMS PTEAKLFDDA MREHAAEVER 
LRRQLTAMED LGAVLASGVA DGALSVQLHP RARRPDSTNV PFEGTASDFD DDH