Gene Ndas_5370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5370
Symbol
ID	9249273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	549898
End bp	551013
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003683256
Protein GI	297564283
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.861425
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCCA CCGACACCGT CCTCTCCCGG CGTGCGCTGG GCCGCGCCAC CCTCGCCCGC 
CAGTTCCTCC TGCGGCGCGT GGACCGGCCG GTGACCGAGG TCGTCTCCCA CCTGGTCGGC 
CTCCAGGCGC AGACCACGCA CACCTGGTAC GTCGGACTCC AGAACCGGAT CGAGGACCCC 
TCCCCCGAGG ATGTCGGCCG CCAGCTCACC GACGGCGAAC TCGTCCGCGC CACCCTCATG 
CGCGGCACCC TGCACCTGGT CACCCCCGAG GACTTCCGCG CGCTGCGCCC CACGGTCCAG 
CCCGTCATCG CCCGCGGCCT GGCGCACAGC GGCCACGGGA AGGCCCTCGC CGGGACCGAC 
CTGGGCGCCG TGGCGGACGC CGGGCGCGCC CTGCTGGTGA AGGAGCCGCT GACCCCCGGC 
GAGCTGGGCG CACGCCTGGC CGAGCGGTGG CCCGGGGTTC CCGGCGACGA CCTGTCCTAC 
GCGGCGCGCT CCCTGCTGCC CGTCGTCCAG ATACCCCCGC GCGGGGTGTG GGGCTCCTCC 
GGACCGCCCG CGTTCGCGCC CGCCGACACC TGGACCGGGC TGGCCATGGA CGCCGAGCCC 
GATCCGGAGG CGCTCGTGCT GCGCTACCTG GCCGCGTTCG GACCGGCCAC CGTGAAGGAC 
GTGCAGGCCT GGTCGGGGCT GACCCGGCTG CGCGCGGTGG TCGACCGCCT GCGCGAGCGC 
CTCGTGGTCC TGCGCGGCGA GGACGGCGCC GAGCTGTTCG ACCTCCCCGA CGCCCCGCGC 
CCCGGCCCGG ACGTCCCGGC GCCGGTCCGC TTCCTCTACG ACTTCGACAA CGTGCTGCGC 
GGCCACGCCG ACCGCGGCCG GATACTCTCC GGCGAGGACC TGAAGCGGCT CGCCTCCCGC 
AACGGGATGC CGCCCGCGAC GGTGCTCGTG GACGGCGAGG TGCGCGGCTC CTGGAAGGTG 
GTCCGCGCCG GGGGGACGGC GGCCGTGGAG GTGACGCCGT TCCGGCCGAT CGGGGCCGCC 
GACCGCGAGG AGGCGGAGGC CGAGGGGCTG CGGCTGCTGG CCTTCCTGGC GCCGGAGCGC 
GACGCGCACG AGGTCCGGTT CGCGTCGCCC GCCTGA

Protein sequence

MAATDTVLSR RALGRATLAR QFLLRRVDRP VTEVVSHLVG LQAQTTHTWY VGLQNRIEDP 
SPEDVGRQLT DGELVRATLM RGTLHLVTPE DFRALRPTVQ PVIARGLAHS GHGKALAGTD 
LGAVADAGRA LLVKEPLTPG ELGARLAERW PGVPGDDLSY AARSLLPVVQ IPPRGVWGSS 
GPPAFAPADT WTGLAMDAEP DPEALVLRYL AAFGPATVKD VQAWSGLTRL RAVVDRLRER 
LVVLRGEDGA ELFDLPDAPR PGPDVPAPVR FLYDFDNVLR GHADRGRILS GEDLKRLASR 
NGMPPATVLV DGEVRGSWKV VRAGGTAAVE VTPFRPIGAA DREEAEAEGL RLLAFLAPER 
DAHEVRFASP A