Gene Ndas_5098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5098
Symbol
ID	9248988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	240877
End bp	242271
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682985
Protein GI	297564012
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0121004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.708615
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGACGG ACACCTACAG CGAGGACGCC GCGCTCATCG GCGAACGCCA GGCCGCGGCC 
CGCGCCCTCC TGGCCCATCC CCTGCTCACC GAGCGCACCC ACCCCGCCGA GTTCGCCCTC 
GTGCGCTCCC ACACCGAGTG GCTCGTCCAG CGCTTCCAAC GCGTGCTCGG CTACCGCCTG 
ACCGTCGCCG AGGACCACGC CCGGCTGGTC AAACGCGGTC TCGTCACCGA GGTCGCGCGC 
CCCCTCGCGC GCGGGACCGG CGCCCCCTTC ACCCCGCGCA CGCACACCTA CCTGGCGCTG 
TCCCTGGCCG TCCTGGTCGA GGAGCAAGGC CCCACCACCG TCCGCGGCCT GGCCGCGCGG 
GTCCGCTCCG CCGCGCACGA GGCCGGGGTC GACGCCGACC CCGAGCGCGG CCTCGCCGAG 
CGCCGCGCCT TCTGCGCCGC CCTGCTCCAC CTGGTCTCGC TCGGCGCCCT CACCGAGGAC 
TTCGGCACCA TCGCCGACCA CCGTGAGGAC CCCTCCGCCG ACGCGGAGCT GATCCCGCAC 
ACGCAGGTCC TGCGCTCGGT CGCCGTCCAC CTGCCCCGCG CCTCCGACGA CCCCGACTCC 
TTCCTCGCCG CCGCACGCGA CACCGACCCC GACGGCGACC ACCAGGGCGA GACCGCCCTG 
CGCAGGCTCC TCGCAGAGAC CGCCGTCGTC TACCGCGAGG AGCTCCCCGA CCGCCAGCGC 
GACCGCCTCG CCGCGCACCA GTGGCGGGCC GCAGCGGCGC TCGGCAACCT CCTGGGCTGC 
GACACCGAGG TCCGCGCCGA GGGCGTCGCC CTCGTGATGC CCGACGAGGC GGGCGCCCGC 
CCCGCCTTCC CCTCCGACGA CCCCGTCGGA CAGGTCGCCC TGGCCCTGGT CCGCCACCTC 
TCCGGCCGCC TGCACCCCGG CCGCCCCGCC ACCTCCGCCC CGGTCCCGGA GGAGGAGATG 
AACACCGCGC TGGAGGCCCT CTGCGGCGCG GACGCGCCCG CGCGGGCCGA GTGGGCCCGC 
ACCGCGGGAC CCGAGATCCC CGACCCCGGA CGGCTCCGCG AGCGGGTCCT GGTCCTGCTG 
GCCGACCTCG GACTGCTGCG GGGCGCCCCC GGACGGTGGC GGCTCACCGC CGCGGCCGCC 
CGCTACGGGG CCGAAACGGA CATCCGTGTC CCCCCGATCC AGGACAATGA CGAAGACAGC 
CGGACACATC CCGACCCGGT GCGTGCCCCC GGCGACGACG AGGGCGAACC CGACGCTCCC 
GCCGACCCCC GCGGCGACCT GAGCCGGGTG GCGTCCGTGC TGCAAGCGGT GGCGAACGAG 
AAGGTGAGCG CGACCAGTGG TGACTCAGGA GACCAGCCAG GCCCCGGAAG CGGCGGCGGC 
GACGGGTCCG GCTGA

Protein sequence

METDTYSEDA ALIGERQAAA RALLAHPLLT ERTHPAEFAL VRSHTEWLVQ RFQRVLGYRL 
TVAEDHARLV KRGLVTEVAR PLARGTGAPF TPRTHTYLAL SLAVLVEEQG PTTVRGLAAR 
VRSAAHEAGV DADPERGLAE RRAFCAALLH LVSLGALTED FGTIADHRED PSADAELIPH 
TQVLRSVAVH LPRASDDPDS FLAAARDTDP DGDHQGETAL RRLLAETAVV YREELPDRQR 
DRLAAHQWRA AAALGNLLGC DTEVRAEGVA LVMPDEAGAR PAFPSDDPVG QVALALVRHL 
SGRLHPGRPA TSAPVPEEEM NTALEALCGA DAPARAEWAR TAGPEIPDPG RLRERVLVLL 
ADLGLLRGAP GRWRLTAAAA RYGAETDIRV PPIQDNDEDS RTHPDPVRAP GDDEGEPDAP 
ADPRGDLSRV ASVLQAVANE KVSATSGDSG DQPGPGSGGG DGSG