Gene Ndas_4361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4361
Symbol
ID	9248236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5195210
End bp	5196607
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	67%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682256
Protein GI	297563282
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.77847
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGG GTTTCCGCGT CGAGAACCAC AAGTCCATCC GGGAGGAGCA ACAGCTCCTG 
CTCACTCCCG TCTACGACGA CGCCCGCCCG CAGGAGGCCG GCTGGGAGGC CACCACGGTC 
GCGGGGGTCT TCGGGGCCAA CGCCTCGGGC AAGTCGAACC TGCTGGACGC GCTCTCCTTC 
ATGCGGGACA CCGTCCGGTG GTCGATGAGC CACAACGAGC CGGGGAGCGG AATCCAGCGC 
CACCCCTTCA AGTTGAGCGC GGACGCCCGG GAGGAGCCCT CCACGTTCGT GGTCGACCTC 
GTGATCGACG GTGTCCGCCA CACCTACGGA TTCGGGGTCG ATGACGAGCG GGTCGTGGAG 
GAGTGGTTGT ACAGCTACCC CAGACAGCGC AGACGCGTCG TGTTCGAGCG TGAGGGGGAG 
GAGTTCTCCT TCGGTGACCA GACCTCGGGG AAACTGCGCC AGGTCAAGGA GATCACCGGT 
CGGAACGTCC TCTTCCTCAC CGTCGCCGCC CGCGCCTCGA ACGCGGAGGT GGAACCGGTC 
TACCGCTGGT TCTCCGAGGG CCTGGTGTCC GCCACTGAAC GCAGCCCGGA CCACCCGGCC 
TGGTTGCGTG GAGGAGCGGC CTCCGAGGAG CGCATGACCG CTCTCGGTCG CCTGCTGAAG 
TCCGCTGACA CCGGCATCGA GGCCGTGGAA CTGCATGAGC AGGGTTCCGG TTCCGGGCCC 
GGGACGGCAA CCTCCAAAGC AGTGCTGGCC GCAGGGGAAT GGCCCCGTCT GTGGGCTAGG 
AAGCAGTCCT CACAGGAGCG GCGGGACGAC CGCGGATCCG GTGTCGTCCA CCTCGCGACG 
GGCAGCGGTA AGTCGTCCTA TGTGGCGCTC CTCGCAGACC TGATCCGCGA ACGCACCACG 
CTCCTCTTCC ACCACCGAGG AGACGAGTCC GCGACCCCGC TCCTGTGGGA GGAGGAGTCA 
CTGGGCACCC GAGCGTTCAC CACGATCGGC TTCGACGCCC AACGCGCCCT GGAAGCAGGC 
GGTGTCCTCG TGGTCGACGA GATCGACGCC AGCCTCCACC CCTACCTCTC CGCCAAGGTC 
ATCTCCCTCT TCCAGGATGA AGAACACAAC CCCAAGGGCG CCCAACTGAT CTTCACCAGC 
CACGACGCGG CCCTGCTCGG ACGCGTACGC GGTGAGGAGG TCCTCAAACG CGACCACATC 
TGGTTCGTGG ACAAGGACGA CCGTGGACGG ACCTCGCTCT ATCCGCTCAG CGACTTCAAG 
CCCCGGGGGG ACGACAACCG CGCCCGGCGC TACCTCACGG GCCGCTACGG CGCGGTTCCG 
GACGTGGACG ACGAACTGTT CCGGGACGCC CTGCACCGGC GCGAGCAGTC ACGGGAGTCG 
GAGGAAGCCG CCCCGTGA

Protein sequence

MLLGFRVENH KSIREEQQLL LTPVYDDARP QEAGWEATTV AGVFGANASG KSNLLDALSF 
MRDTVRWSMS HNEPGSGIQR HPFKLSADAR EEPSTFVVDL VIDGVRHTYG FGVDDERVVE 
EWLYSYPRQR RRVVFEREGE EFSFGDQTSG KLRQVKEITG RNVLFLTVAA RASNAEVEPV 
YRWFSEGLVS ATERSPDHPA WLRGGAASEE RMTALGRLLK SADTGIEAVE LHEQGSGSGP 
GTATSKAVLA AGEWPRLWAR KQSSQERRDD RGSGVVHLAT GSGKSSYVAL LADLIRERTT 
LLFHHRGDES ATPLLWEEES LGTRAFTTIG FDAQRALEAG GVLVVDEIDA SLHPYLSAKV 
ISLFQDEEHN PKGAQLIFTS HDAALLGRVR GEEVLKRDHI WFVDKDDRGR TSLYPLSDFK 
PRGDDNRARR YLTGRYGAVP DVDDELFRDA LHRREQSRES EEAAP