Gene Ndas_4644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4644
Symbol
ID	9248525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5516880
End bp	5518028
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682536
Protein GI	297563562
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCCGG AGATCGTCGA GGCGGCCCGC GAGGTGCAGC TACCGCTCCT GGCGGTGCTG 
CTCCTGGTCG GAGCCGTCGC CAAGACCACC AGTCGGGCGG CCGCCACGGG CCTGGCCGTC 
CTGGCGCCCG AGCGGCTGCG CCGGGCGTCC ACGGTCGGCA CCGGCCTGCT GGAGGCCGCG 
CTGGCGCTCG GCCTGCTCGG ACTGACCGGC CTGTTGGGCG AGGCGGTGCG GGCGCTGACC 
GCGGTCGTGT TCGCCGTCTC GGTCGTGGTC CTGGTGGTGA TCCGCAGACG CGACCCCGAG 
GCGGGCTGCG GCTGCTTCGG CGGGCTGAGC CAGGCGCCGA TCGGCTGGCG GACGCTGGCC 
CGGGCCGGAC TGCTGTCGGC CGCCGCGCTG TCCACGCTCG GCCTGGAACC CGCGGGCTGG 
GAGGCGGTCG CCCCGCCGAC CCCGCTGCAC GCCGGGGTCC TGGGCGCCGA ACTGCTGCTC 
CTGGCCCTGC TGAGCCCCGA ACTGCGCACC TCGGCCGCGC GCACCCTGCA CGAGGAGCCC 
TGCGCGCTGC GCGAGGTTCC GCTGCGCCGC ACCGTGCGGA CCCTGCGCCG CAGCGACGTG 
TGGCGCGTCA ACGAACCGGT GATGCTCGGG ACCGAACCCG AGGACGTGTG GCGTCAGGGC 
TGCTGGAGGT TCCTGCGCTA CGACGGCGTA CGGCACGGCC GCCGGGTCGA CGTGGTGTAC 
GCGGTCAGGG CCGGGGGCAG GCGCGGCACC GCGGTGCGCG CGGCCCTGGT CGACCGCGAG 
AGCGGAGCGG TGGTCGCCTC CTTCGGCGCG GTCACCCGCA TCGAGCTGAC CGGCCCGCCG 
CGCAAGCTCC TCCACCCGGG GGAGGCGGCC CGACGGGACG CGTGGCGGCA CGACGAGGCC 
AGGGCCGAGC TGAGCCTTCG GACCGCCCGG GAACGCTCCG CCGTGTGGGA CCTCGTCGCG 
GGCGGATCCG ACGAGAGCGC CCGGGACGAA GGCGTTCGGG AGGGCGACGT CCAGGGCGAA 
CGCGTTCCGG GACAGCGCGG TCCGAGCGGG CGCGAGGAGG TCGGCCGGGA CGCGGCGGAG 
CAGGGCGCCG CGGAGCAGGG CACCGGCGGG ACGGATCGGG GCGGGCGCGA ACCGACCCCG 
GCCGGATGA

Protein sequence

MLPEIVEAAR EVQLPLLAVL LLVGAVAKTT SRAAATGLAV LAPERLRRAS TVGTGLLEAA 
LALGLLGLTG LLGEAVRALT AVVFAVSVVV LVVIRRRDPE AGCGCFGGLS QAPIGWRTLA 
RAGLLSAAAL STLGLEPAGW EAVAPPTPLH AGVLGAELLL LALLSPELRT SAARTLHEEP 
CALREVPLRR TVRTLRRSDV WRVNEPVMLG TEPEDVWRQG CWRFLRYDGV RHGRRVDVVY 
AVRAGGRRGT AVRAALVDRE SGAVVASFGA VTRIELTGPP RKLLHPGEAA RRDAWRHDEA 
RAELSLRTAR ERSAVWDLVA GGSDESARDE GVREGDVQGE RVPGQRGPSG REEVGRDAAE 
QGAAEQGTGG TDRGGREPTP AG