Gene Ndas_3766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3766
Symbol
ID	9247635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4524169
End bp	4525407
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681670
Protein GI	297562696
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGAACG AAACGCTAGA ACGCCTGCGC CTTCCGGGGG CCTGGGTCCT GCTTGCAGCC 
GCGGGCGTGC TCATGCTCTC CGGACTCATC CAGGTGATCG TCCGATCCAG CGGCTGGCGC 
TCGGAGACGT CCTTCGCCTC GGCCATGTAC GACGCGGGCT CCGCCAACTT CTTCGGTGTG 
ACCATCACGA TCCTGGTCGC CGTCGCCGTG GCCCTCGTGC TGACCAGCGA AAGGACCAGG 
GCGGGCGCCT CCCCGGTCGT GCTGACCGCG ATGATCATCA CCGGTGTGGG CCTGCTGTTC 
TGCCTGATCA CGGTGATCTG CGGCTTCATC GACGCGATCA ACATCGGCCA CGGCTTCGCC 
CGGATGCTGG GGACCGTCGC CCAGGGCGCG GTGCTCGGCA TCTTCGGCTT CGCCGCGCTC 
AAGGCCTTCA ACGACCCCAC CCTGGTCCCC AGGGTGGTGC GGCCGCAGAA CGCCTACCCG 
CAGCAGTTCC CGCCCGCCAC CGGCGCGCAG CAGTCCTTCG CCCAGCCGGC CTACCCGGGC 
CAGCCCGCCG ACCCCGCCCA GCAGTACGGC GTGGACCCCG CGCAGCAGGC CTACGGCCAG 
CAGTACGGGA CCGATCCCGT CCAGCAGCAG TACGGGACCG GCGCCCAGCA GGCCTACGGC 
CAGCAGTACG GCACCGACGC CCCGGCCCAG CAGTACGGGA CCGACCCCGT GCAGCAGCAG 
TACGGCACGG GCGCCCAGCA GGCCTACGGC CAGCAGTACG GCACCGACGC CTCCGGGCAG 
CAGCCCGTCC AGCAGGGCTA CGACGCCTCC CAGCAGTACG GCCAGCAGTA CGGGGCGGAC 
CCCGCGCAGC AGGCCTACGG CCAGCAGTAC GGCACCGACG CCCCGGGCCA GCAGGCCGCC 
TACGGCCAGC CGGGCGAGTA CGCCTACGAC CCGTCCCAGT ACGCCCCGCA GAGCACCGAG 
CAGCAGCCCG CCTCCGGCGA GCAGGCCGCC CAGGACGCGA TCCAGTACGG CTGGTACCAG 
GGCGCTGACC AGGGGCAGCA GGCGCAGGAC ACCCCCGCCG ACAGCAATCT TGATCCTTTC 
TTTAACTCCG GTGAGAACAA CGGCAACCAG ACGCCCGGCC AGGGCGGCGG ATCGTACGGA 
GGGCAGTACG GAGCGGGCAC CGGATACGGC TCTGACCAGC AGGGACAGGG CGGAACCGGT 
GACCAGCAGG GGTGGTACGG CGGCGAGGAC AAGCGCTGA

Protein sequence

MKNETLERLR LPGAWVLLAA AGVLMLSGLI QVIVRSSGWR SETSFASAMY DAGSANFFGV 
TITILVAVAV ALVLTSERTR AGASPVVLTA MIITGVGLLF CLITVICGFI DAINIGHGFA 
RMLGTVAQGA VLGIFGFAAL KAFNDPTLVP RVVRPQNAYP QQFPPATGAQ QSFAQPAYPG 
QPADPAQQYG VDPAQQAYGQ QYGTDPVQQQ YGTGAQQAYG QQYGTDAPAQ QYGTDPVQQQ 
YGTGAQQAYG QQYGTDASGQ QPVQQGYDAS QQYGQQYGAD PAQQAYGQQY GTDAPGQQAA 
YGQPGEYAYD PSQYAPQSTE QQPASGEQAA QDAIQYGWYQ GADQGQQAQD TPADSNLDPF 
FNSGENNGNQ TPGQGGGSYG GQYGAGTGYG SDQQGQGGTG DQQGWYGGED KR