Gene Ndas_0164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0164
Symbol
ID	9243995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	205968
End bp	207206
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	72%
IMG OID
Product	LPXTG-motif cell wall anchor domain protein
Protein accession	YP_003678120
Protein GI	297559146
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTACG TGTCCCTCCC CCATTCCGTC GGGCGCGCGA CTCTCGCCGC CTCCGCCGCC 
GCGCTCCTCG CCTTCGGGCT CGCCGCTCCG GCCTCCGCCG ACCCGGTGGA GACCTACGAG 
GGCTCCGTCC GCGCCCAGTA CCCCGCCACC GCCGCGTCCG GCGTGGACGT TCGGATCAAC 
GGTGAGATGG AGAGCACGAG TCTCTTCGAC CTCCGGTTGG AGAACGGCAC CGCCCTCACC 
GCCTACTGCA TCGACCTTGA GACCAGGATC AAGGACAACG CCTGGTACCT GGAGGACGAC 
TGGGCGAACT ACCCGGGCAG GGGCGACTTC GCGGAGCCGG GCAAGGTGCA CTGGATCCTC 
CAGAACAGCT ACCCGACCGT CAGCGCCGCC CAGCTCGCCG AGAACGCGGG GCTGAATCGG 
GGCAACGCCC GCCACTTCGG TGATGAAGAG GCGATCGCCG CCACCCAGGC CGCCATCTGG 
CACTTCAGCA ACGGCGCCGA GGTGACCGCG AACGACCCGA ACGGCGTCAG GGCGGTCTAT 
GACTACCTGG TCGGGGAAGC CCAGGACCTC CCGCAGGAGC CCGGTCCGAC CCTGAGCATC 
ACCCCGGGCG AGGCCTCCGG CAGCGCGGGC GAGACGATCG GCGAGTTCCT CGTCGAGACC 
AGCGACGCGG ACGGCATCGA GGTCAGCGTC CAGGCCCCCG AGGGTGTCGA GGTCGAGCTG 
GTCGACCTGG AGACCGGCCA GCCCGTCACC ACGGTCAACA ACGGTGACAC CGTCGGCCTG 
GCCGTTCCGG AGGGCGCGGC GGAGGGCACC GCCTCCTTCT CCCTGGAGAC CACGGCCACC 
GTGCGGTCCG GCCGCCTGTT CAAGGGCGAG GAGGAGTACC AGCCGACCCA GACCCTGATC 
ACCGCCCAGG ACAGCGAGGT CACCGTCTCC GCCTCGGCCT CGGTCTCCTG GACCGGCGGC 
GGCGAGACCC CGCCCCCCAC GGAGGAGCCG AGCGAGGAGC CCTCCGAGGA GCCGAGCGAG 
CCCGAGAGCC CGGAGCCGAC CCCGAGCGAC GAGCCCTCCG AGCCCGTCGA CAAGCCGTCC 
GAGCCCGCCG ACGACCAGAA CGAGCCCAGC CTGCCGGTGA CCGGTGGCGC GCTCGTCGGC 
CTGGTCGCCG CCGGTGTGGC CGCGCTCGGC GCGGGCGGCG GCGCCCTCTA CCTGAGCCGC 
AGGCGCAAGG CGGCGGGCAG CCAGGACCTG GAGGGCTAG

Protein sequence

MTYVSLPHSV GRATLAASAA ALLAFGLAAP ASADPVETYE GSVRAQYPAT AASGVDVRIN 
GEMESTSLFD LRLENGTALT AYCIDLETRI KDNAWYLEDD WANYPGRGDF AEPGKVHWIL 
QNSYPTVSAA QLAENAGLNR GNARHFGDEE AIAATQAAIW HFSNGAEVTA NDPNGVRAVY 
DYLVGEAQDL PQEPGPTLSI TPGEASGSAG ETIGEFLVET SDADGIEVSV QAPEGVEVEL 
VDLETGQPVT TVNNGDTVGL AVPEGAAEGT ASFSLETTAT VRSGRLFKGE EEYQPTQTLI 
TAQDSEVTVS ASASVSWTGG GETPPPTEEP SEEPSEEPSE PESPEPTPSD EPSEPVDKPS 
EPADDQNEPS LPVTGGALVG LVAAGVAALG AGGGALYLSR RRKAAGSQDL EG