Gene Ndas_0602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0602
Symbol
ID	9244444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	738436
End bp	739845
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678555
Protein GI	297559581
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.437149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAAC CCGAACACGT CGGCGGACTC CTAGGCCCCG CCCTGGCCCG CATCACCGCC 
CTGGACGAGA ACCACCTCGA TCGGTGGATC GCCCGCGCCC GTGCCCTGCG CGGCTGCGCC 
TGCCCGGTGC GCCTGACCGG CGAGACGACC CGTGTGGACG CCTCCACCGG GGAACTGCTC 
TCGCGCTACT CCACCGCCAC CGAACCCGGC AACGAACTGC TCATGCGGTG CAAGAACCGT 
CGGGCCTCGC GCTGCCCCTC CTGCTCGGAG GAGTACCGGG CCGACACCTA CCACCTGGTC 
AAGGCCGGAA TCGTCGGCGG AGACAAGGGC GTGCCCACCT CGGTCGGCGT GCACCCCCGG 
GCCTTCCTCA CCCTGACCGC TCCCTCCTTC GGCGCGGTCC ACCGTGGCCC CGGCAAGGAC 
GGCCGCACCC GGGTGTGCCA CCCTCGCCGG ACCGGCGCGG CCTGCTTCAC CCACCACCGC 
GCCGACGACC CCCGCATCGG TCAGCCACTC GACCCGGCCG CCTACGACTA CATCGGTCAC 
GTGCTCTGGC ACGCCCACAC CGGGGAGCTG TGGCGGCGCT TCACCCTGTA CCTGCGCAAC 
CACCTGGCCT CGGCCGCCGG TCTCTCGCGC ACGGACTTCT CCAAGCGGGT GCGCATCTCC 
TACGCCAAGG TCGCAGAGTT CCAGTCCCGG GGCGCGGTGC ACTTTCACGC CGTGATCCGG 
CTGGACGGCT ACACCAAGGA CCCCACCGGC TGGCCGCCGC CTCCGGTGTG GGCCAGCATG 
GACATGCTCA CCGCGGCCGT GGACTCGGCC GCCCGCACGG TCTCGCTCAC CTCCCCTGAG 
ATTAACGGCC GTACCTGGAC TCTGGGGTGG GGTGAGCAGG TGGACGTGCG CCCCATCGAG 
GACTTCGGCC CCGACCGGGC GTTGACGGAC ACGGCCGTGG CCGGGTACAT CGCCAAGTAC 
GCCACCAAGG CCGCTGAGGA CACCGGCACC CTGGACCGGC GTATCCACGA CATCGACCAC 
GTGGACATGA CGCAGGTGCG CCCGCACGCG GGCAAGCTCA TCTACACCTG CTGGCGTTTG 
GGCAACACGC GCCTGTACCC CCAGCTCGAA GACCTCAAGC TGCGCCAGTG GGCGCACATG 
CTCGGGTTCC GCGGTCACTT CTCCACCAAG TCGCGCCGCT ACTCCACCAC CCTGGGTGCG 
CTGCGTCAGG TGCGGGCCGA CTACGCCGCC GGACGTCCCT GGGACACCGA GACCTTTACC 
CCGCTCGTGG TCCAGGGCGA AGAGGGTTCG ACGCTGAGCC TGGGCAACTG GCACTACCTC 
GGGCAGGGCC TCACCCCGGG AGAGTGGGCG CTGGCGTCCT TGGTCGCCGG GATGGGCCGC 
ACCACCGAAG ACGGGGAGGT GGACAGGTGA

Protein sequence

MPEPEHVGGL LGPALARITA LDENHLDRWI ARARALRGCA CPVRLTGETT RVDASTGELL 
SRYSTATEPG NELLMRCKNR RASRCPSCSE EYRADTYHLV KAGIVGGDKG VPTSVGVHPR 
AFLTLTAPSF GAVHRGPGKD GRTRVCHPRR TGAACFTHHR ADDPRIGQPL DPAAYDYIGH 
VLWHAHTGEL WRRFTLYLRN HLASAAGLSR TDFSKRVRIS YAKVAEFQSR GAVHFHAVIR 
LDGYTKDPTG WPPPPVWASM DMLTAAVDSA ARTVSLTSPE INGRTWTLGW GEQVDVRPIE 
DFGPDRALTD TAVAGYIAKY ATKAAEDTGT LDRRIHDIDH VDMTQVRPHA GKLIYTCWRL 
GNTRLYPQLE DLKLRQWAHM LGFRGHFSTK SRRYSTTLGA LRQVRADYAA GRPWDTETFT 
PLVVQGEEGS TLSLGNWHYL GQGLTPGEWA LASLVAGMGR TTEDGEVDR