Gene Ndas_3373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3373
Symbol
ID	9247238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4031351
End bp	4032571
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681284
Protein GI	297562310
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGGGGC CGCTCTCCCT GGCCCACGCG TTACAGCGCC TGGCGAGGAT CCCGTCCATG 
CGGCGCAAGT ACGGCCGTTA CCTCGTGCTG GGGCGCAGGC CCCGCCTGGT GGACCTGCCT 
CCCCTCACCC GTGAGGAGCT CGGCGAGGCC GTCGACACGA TGATGCGGGA GTCCCCGGCC 
GAACTCTCCC GGGCCTCGCT CCACCTCATG GGGGGAACGA CGTCCACGAG CCGGTTGGGC 
GCGCTCCCCT CCGACCTCCA CGTGGACGAG ATCGCCCCGC ACCTTCAGCC CTTCGCACCG 
GGGGACCTGG TCGCGAGCCT GAGCACCCCG TTCCACATGC GCGCGTCGCA CGACCTGCAC 
AACGCGCTCG CCGCACGGGC CGGCGTCCCC ACCCTGTCGC TCGACGCCCC GACGGACCAG 
ATGATCGAGC CGTGCCTCGA CCTCTTCGAG CGGCACGGGG TGAGCGCCCT CGCCGCCACC 
CTGGACACCG TCCAGCGCGT CCTGCGCTTC TGCGCCGCGT CCGGACGGCG CCTGGACTTC 
CTGCGCAAGG TGCTCTGGAG TGGACCGGCG ATGGACGCGG GGACGCGCTC GCTGATCCGC 
ACGCACTTCC CCCACCTGCG CACATGGGCG CTGTTCGGCT CCGCGGAGAC CTGGATCATC 
GGGCACAGCG GACCCGACTG CGCGATCGAC ACCTTCCACC CGCTCCCCTA CCAGCACACC 
GAGGTCGTCA ACGGGCGCAT GCTCGTGACC GTCACGCACA GGAAGGCGGT CGTCCCCCTG 
TTGCGCTACG ACACCGGCAC CGGGGCCGAG TGGACGTCGT GCACCTGCGA GCTGCCCGGC 
CGGCCCCTGC GGACCAACAG CCGCATAGAC GCGCCCTACG GTCCGCTCAG CAGTCTGGTG 
TCCCCCGCCG ACCTGGCGTC GCTCGCCCTC CAACTCGACT CGGTGGAAGC CGCCCAGGTG 
GTCCTGATCC GTCCGCACAC CGAGAACGAG CGGCTGCGCC TGCGGGTCCG GCTCCGCCCC 
GGGACGGAGC CGGACCTGTA CACCGTCGAG TGGATCCGGC ACCACGTGGT GTCGGGCTGC 
CTGGCCCTGG CGGAGGTCAT CGAGGAGGCC CCCGAGACCT TCGAGGTGAC CCTCTCCCGG 
CGGCTGCTGG ACCAGTCCTC GGACGGCTCG GCGCCGACGA TGGTGGTCCG CACCGCCTCC 
CGGGGCCGCT GCTCCGCGTA A

Protein sequence

MEGPLSLAHA LQRLARIPSM RRKYGRYLVL GRRPRLVDLP PLTREELGEA VDTMMRESPA 
ELSRASLHLM GGTTSTSRLG ALPSDLHVDE IAPHLQPFAP GDLVASLSTP FHMRASHDLH 
NALAARAGVP TLSLDAPTDQ MIEPCLDLFE RHGVSALAAT LDTVQRVLRF CAASGRRLDF 
LRKVLWSGPA MDAGTRSLIR THFPHLRTWA LFGSAETWII GHSGPDCAID TFHPLPYQHT 
EVVNGRMLVT VTHRKAVVPL LRYDTGTGAE WTSCTCELPG RPLRTNSRID APYGPLSSLV 
SPADLASLAL QLDSVEAAQV VLIRPHTENE RLRLRVRLRP GTEPDLYTVE WIRHHVVSGC 
LALAEVIEEA PETFEVTLSR RLLDQSSDGS APTMVVRTAS RGRCSA