Gene Ndas_4624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4624
Symbol
ID	9248505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5492321
End bp	5493754
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682516
Protein GI	297563542
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000471714
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.246697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCCACG ACGCGGTCGC CCTTCTGGCC AGCCCTCCCG ACCGGCGCGC CCTGACCAAG 
GCCCTGGTCG CCGCCGGACC CGACCTCCGG GTGCGGTTCG CGGCCGACGG CGCCGTGGTC 
GAACTGCTCG ACGCCGGGGG CCGCCTGGTC GCCGCCGTGC AGGCGGCCCA GCGCCTGGCC 
CTGTCCGCCG AGGCCGAACG GCTCCTGTCC GACGGCATGG TCGACGACCT GCCCGCCCAG 
CCCTACTGGG TGGAGGCGCG CGGCGCCGAA CTCGCGGACA CCGACACCGC CGGGGCCGTC 
GGCCGCTTCG TCCGCGACCT CGCGGACCGG CTCGGCGGCG TCGTGTGGGA GCCCGAGCCG 
CGGCTCTCCC GCGGCGACGC CTTCCTGGAC GGCTCCACCG ACCACCCCGC CGTCACCGCC 
CGCACCGACA GGGCCGTGGT CGTGGTGCAG GACCGCCCCC TGGTCCCCAT GTCCCCCTGG 
CTCGTGGACA CCGTCGCCGC CCACGGGCGC GAGGGCCTGC GCCTCCAGGT CGTCACCCCC 
TCCACCAGCC GCCTCACCCA CGCACTGCGC TCGGTGCTGG CCGACCCCAC CGCCCGCTGG 
GTGGTCCAGG CCCCCGACGG CGCCTACTAC GACGGGTTCT CCGGGGTGCC CCTGGTCTGG 
GACGAACGGG AGGCCTTCGT CCTGGACCGG AGCGCCCGGG CCGAGGACGG ACCGCACGAG 
GCGTTCCGCG CCCGGGCCGA GGATGTGGAG GGGACCGGCT CCCACCTGCT CGTCGAGCTG 
AAGGCGGAGC ACCCCGCCGA CAACGGCCTG GTCCTGGGCG AGGCCGCCGA ACTGCTCGCC 
GAGCGCCTGG GCGGCCGCGC CCCCGCGCTC TGGGGCACCA GCGAGCCCCT CCCCCAGGAG 
TGGAACCGGG CGGCGCTGAC CCGGCTGTGC CGCGAACGCG CGCCCGGGCA GACCTGGTTC 
GTGTTCACCG GCCCTCCCGA GGGCGTGCGC GAGGAGGGCG TGCTCCCCTT CTGCGGCACC 
CAGCGGGTGA TGCGCACCGC GCACGGGGTG CGTGAGAGCG TCTCGTTCGC GGTGGCCCGG 
CCCGCGGGCG AGGAGCACGA CCTGGACGCG TTGTCGTCGG TGGTCCGTAC ACTCACCGAA 
CGCGATGTGC TGCGGACCAT GACGGTGCGG CGCGCGGCCG GGCGGCCGGA CCTGACCCAC 
GAGCCCCGCT GGTGCGGCCT CCCCCTGCCG GTCGGCCTGG CCGTGGGGGT GGAGGGCGTC 
TCCTCGATCG GCACCGACCG GGCGCTGTCC GCTCCGGTGC GCGGGGTGCC GTTCGGCCCG 
CCGCTCACGC CCTCGGTCTG GTACCGGGTC GGGGACGGCA CCGAGCCGGA CGGCTGGCAG 
CGCTTCCGCG AGCTCATGGA CCACCTGCAC CCCGACGGGG CCCGCGCGGG CTGA

Protein sequence

MSHDAVALLA SPPDRRALTK ALVAAGPDLR VRFAADGAVV ELLDAGGRLV AAVQAAQRLA 
LSAEAERLLS DGMVDDLPAQ PYWVEARGAE LADTDTAGAV GRFVRDLADR LGGVVWEPEP 
RLSRGDAFLD GSTDHPAVTA RTDRAVVVVQ DRPLVPMSPW LVDTVAAHGR EGLRLQVVTP 
STSRLTHALR SVLADPTARW VVQAPDGAYY DGFSGVPLVW DEREAFVLDR SARAEDGPHE 
AFRARAEDVE GTGSHLLVEL KAEHPADNGL VLGEAAELLA ERLGGRAPAL WGTSEPLPQE 
WNRAALTRLC RERAPGQTWF VFTGPPEGVR EEGVLPFCGT QRVMRTAHGV RESVSFAVAR 
PAGEEHDLDA LSSVVRTLTE RDVLRTMTVR RAAGRPDLTH EPRWCGLPLP VGLAVGVEGV 
SSIGTDRALS APVRGVPFGP PLTPSVWYRV GDGTEPDGWQ RFRELMDHLH PDGARAG