Gene Ndas_0540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0540
Symbol
ID	9244381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	663713
End bp	664813
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003678493
Protein GI	297559519
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTGC GACGGATCCT CCCCCACACC GCCCCTCCGT CCCGGCGGCG CGCCCCGGGC 
AGAGGCGACG ACGGACAGGC CAACGTCCTG CTCCTGTTCG GGCTCACCCT GGCCCTGCTC 
TCGCTGACCC TGCTGTTCGT ACGGGTGGGC GCCGCCAACG ACCAGCGCTC GCGGACCCAG 
ACCGCGGCCG ACGCCGCCGC GCTGGCGGCG GTGGGCGCCC TCCAGGACCG GGCAGCGCAG 
GACATCGTCG ACGGCGCGTA CCCCATGCCC TGGTTCGACG AGGAGGCCGC CGAGGCGCGC 
GCCGAGGAGT ACGCGCGCAG CAACGGGGCG GTCCTCACCG ACATCCGCGC CAGCGACAAC 
GTCATGGGAC GCAGCGGGAA CATCGTGCGG GTGGAGGTGC GCGGCGCCGT GTGCCAGCGC 
GAACTGGAGG AGGACGGGTC CCGGCACTGG AACGACGTGG TCTGCGACGG CAGCGAGGAG 
GAGACCAACA CCGTGGTCGG CAACGCCTCG GCCATCGCCA TCGTCCGCAT CCCCCATCAG 
TGCGGGCGCG ACGGGGGCGA GCTGGTCTGC GACGGCGGCA CCGTCGACGA CCTCGCCTCC 
GCCAAACGGC TGATCGACGT GCACCTGGTC GACCAGGAGG GCCGTTACAG CTTCAACCCC 
AACTTCGTCG GAGGGGGCGG GCCCGCCGTG GACTGCGACT CGCTGGGGTC ACTGCACCCC 
ATCATGTGCG CGGCGCACCA GCGCCTCCAG CAGGAGTTCC CGGGCTTCTT CCTCTCCGCG 
GGCGGCCGGC GCAACGAACC TGGCAGCGAC CACGACAGCG GCGAGGCGGT GGACTACATG 
ATGGCGGAAC TGGGCGGCGT CCCCACCCCG CAGATGCACG CCAACGCCAT CACCGTGATC 
GACTGGGTGA TCCAGAACTC CCACCAGCTC GGGGTCAAGG GCATCATCTA CGAGCAGCGC 
ATCTGGAACG CGACCGGCGG GAACCCGGAC CCGGTGGGCC CCTGGGCGAG CGTGAGCCGC 
GCCATGGACG ACAGGGGCAG CAACACCCAG AACCACATCG ACCACATCCA CCTGGCGGCG 
GGCGTCGGTT TGATGCAGTG A

Protein sequence

MGLRRILPHT APPSRRRAPG RGDDGQANVL LLFGLTLALL SLTLLFVRVG AANDQRSRTQ 
TAADAAALAA VGALQDRAAQ DIVDGAYPMP WFDEEAAEAR AEEYARSNGA VLTDIRASDN 
VMGRSGNIVR VEVRGAVCQR ELEEDGSRHW NDVVCDGSEE ETNTVVGNAS AIAIVRIPHQ 
CGRDGGELVC DGGTVDDLAS AKRLIDVHLV DQEGRYSFNP NFVGGGGPAV DCDSLGSLHP 
IMCAAHQRLQ QEFPGFFLSA GGRRNEPGSD HDSGEAVDYM MAELGGVPTP QMHANAITVI 
DWVIQNSHQL GVKGIIYEQR IWNATGGNPD PVGPWASVSR AMDDRGSNTQ NHIDHIHLAA 
GVGLMQ