Gene Ndas_5022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5022
Symbol
ID	9248911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	162939
End bp	164216
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682909
Protein GI	297563936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACCCA GCCGCCCGCT GCTCGCCCTG ACGATGGGCA CGCTGCTCCT ACTCCCCGCC 
GGGGCCGCGG CCGCGGCGCC CGCCTCCCCC GCCGCAGAGG CCGACCACGC GCGCGTGGTC 
AGCGAACAGC CCGTGCAGTG GACGCCGCAC GTCCTGGACG GCGCGGTCAA GGACATCCTG 
CGCGTCGGCG ACACCATCCT CGTCGCCGGA AGCTTCACGC GGGTCGGCCA GACCGAGGGG 
GGCCGCGCCC ACGACCTGCC CCACCTGTTC GCGTTCGAGC ACGGCACCGG TCGGATCCTC 
CACGGGTTCG AACCGGAGGT GGACGGCACC GTCACCACGC TGGCCCCCGG CCCCGACGGG 
ACGGTGATCG CGGGCGGGGA CTTCGGCTCG GTGGACGGCG AGCCCGCCGA CGGGCTGGCC 
CGGCTGTCGG TGGACGACGG CGACCCGGTG CCGGAGTTCG GCGCCGTCGT CGACGGTGGC 
CGCGTCCAGC GCATCGCCAG CGACGGCGAG CACCTGTACG TGGGCGGCAG CTTCTCGGGG 
GTGAACGGCG TGGAGCAGCC CACGCTGGTC CGTCTCGACT CCGGGTCCGG CGAGGTGGAC 
ACCGGCTTCA CACCCGACGT GTCCGACGCG CGCCAGGGCG TGCTGAAGGT CCAGGAGCTG 
GCGCTGAGCC CGGACGGGCG GCGGCTGGCC GTCAACGGCT CCTTCACCAG GATCGACGGT 
CACGAGCGGC ACCAGATCGC CATGATGGAC ACCGCGAGCG GCTCGGTCAC ACCGTGGTCC 
ACGTCCGCCT ACGAGGAGCC CTGCGACTAC GAGGAGCTGC ACACCTACAT GCGGCGGATG 
GCCTTCTCCC CGGACGGCTC CTACTTCGCG GTGGTGACGG CGGGCGGCCC GTACGTCAGG 
CCGGGCCTGT GCAAGTCCGT CGCGCGCTTC GAGAACACCG ACACCCCGGG CTCGGAGCCC 
ACCTGGAGCA ACAAGACCGG CGGCGACTCG CTGTACTCGG TGGAGATCAC GTCGGCGGCG 
GTGTACGTGG GCGGACACCA GCGCTGGATG GACAACCCCG AGGGCGCGCT CAACCCGGGG 
CCCGGCTCGG TGGCGCGCGA GGGCATCGCG GCCGTGGACC CCGAGACCGG CAAGGCCCTG 
CCGTGGAACC CCGGCCGGGC GCGCGGCCAC GGCGTGGAGG CGATGCTGGC CACCTCCGAC 
GGGCTGTACG TGGGCAGCGA CACCGAGCGC CTCGCCGACG AGTACCACGC CCGGCTGGGG 
ATGTTCCCGC TCTCCTGA

Protein sequence

MKPSRPLLAL TMGTLLLLPA GAAAAAPASP AAEADHARVV SEQPVQWTPH VLDGAVKDIL 
RVGDTILVAG SFTRVGQTEG GRAHDLPHLF AFEHGTGRIL HGFEPEVDGT VTTLAPGPDG 
TVIAGGDFGS VDGEPADGLA RLSVDDGDPV PEFGAVVDGG RVQRIASDGE HLYVGGSFSG 
VNGVEQPTLV RLDSGSGEVD TGFTPDVSDA RQGVLKVQEL ALSPDGRRLA VNGSFTRIDG 
HERHQIAMMD TASGSVTPWS TSAYEEPCDY EELHTYMRRM AFSPDGSYFA VVTAGGPYVR 
PGLCKSVARF ENTDTPGSEP TWSNKTGGDS LYSVEITSAA VYVGGHQRWM DNPEGALNPG 
PGSVAREGIA AVDPETGKAL PWNPGRARGH GVEAMLATSD GLYVGSDTER LADEYHARLG 
MFPLS