Gene Ndas_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3031
Symbol
ID	9246884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3619093
End bp	3620370
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	76%
IMG OID
Product	hypothetical protein
Protein accession	YP_003680947
Protein GI	297561973
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.416861
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACGCC AACCTCTCGA ACTGGCGCCC TTCCGCGGTC TGCGCTACGC CGACCCCGAC 
GCGGACCGCT TCGTCGACGG GGAGTTCGAC CTCGCGCGAC TCCTGGCCCC TCCCTACGAC 
ATCCCCGACG CCGACGAGGC GCGTGCGCTC CAGCGCTCCG ACCCGCACAA CGCCGCGCGG 
GTCACCCTGC CCTTCGAGCT GAGCCGCCAG AGCCCCGCCG GGACGGGAAG GGCCGTGCCG 
CGCCGCTACC GCACGGCCGC CGAGCTGCTG CGCAGCTGGA TCGACGACGG CGTGCTCGCG 
CTGGACGCGC AACCGGCGCT GTACGTGTAC GAGCAGGTCA CCGCCGACGG GCGGCGCCAG 
CGCGGACTGG TGGGCAACCT GCGCCTGCCC GAGGAGGGCG CCGAACCCGC CGTACGCCCG 
CACGAGGACG TGGCCGACCC GCCGGTGCGC GACCGGTTCC ACCTGATGGG CCTGGCCCGG 
GCCAACCTCG AACCGATCTT CCTGGTCTAC CGGGGCGGCG ACGGGTACGC GTCGGCCGCC 
ACCGAGGCGG TCGCGGGCGC CCCGCTCACG CACGCGCGCA CCCGCGACGG AGCCGAGCAC 
CGGCTGTGGG CGGTCACCGA CCCCGCCGTG CTGCGGCGGA TCAGCGCCGA CCTGGCGGGC 
CGGTCCGCGC TGATCGCCGA CGGCCACCAC CGCTACGCCG CCTACCGGCG TCTGCGCGCC 
GCCCACGACG CCCCGGGCTG GCGCTACGGG CTGGCCCTGC TCGTGGACAG CGACACCCAC 
CCGCCCCGAC TGGGCGCCAT CCACCGGGTG CTCCCCGGCC TGGACACCGA CGCCGCGGTC 
GAGGCCGCCC GCACGGTGGC CTCCGTGGAA CGGGTCGCGG GCCCCCGCGC ACACGCCCTG 
GACCGGGCGG AGGCGCCCGC CCTGCTACTG GTCTCCCCCG AGGGCGACGC CCACCTGGTG 
CACGGCTTCG ACGAGCGGGT GCTGGAGCGG GCCATGCCCG ACCGCTCCCC GCAGTGGCGG 
CACCTGTCCA CGGCCGCCCT GCACCAGGTG CTGCTGCCGC TGTGGGAGGT ACCGGAGGAG 
CGGGTGCGGA TGGTGCACGA CGACGCGGCC GAGGCGGTCG CGGCCGCCCG CGACGAGAAG 
GGCACGGCCG TCATCGTGCC CGCGCTGCGC GTGGAACAGG TGTACGCGGT GGCCGACCGC 
GGGGAGCTGA CCCCCCGCAA GTCCACCTCG TTCGGCCCCA AACCGCGTAC GGGTCTGGTC 
ATGCGCCTCC TGGACTGA

Protein sequence

MPRQPLELAP FRGLRYADPD ADRFVDGEFD LARLLAPPYD IPDADEARAL QRSDPHNAAR 
VTLPFELSRQ SPAGTGRAVP RRYRTAAELL RSWIDDGVLA LDAQPALYVY EQVTADGRRQ 
RGLVGNLRLP EEGAEPAVRP HEDVADPPVR DRFHLMGLAR ANLEPIFLVY RGGDGYASAA 
TEAVAGAPLT HARTRDGAEH RLWAVTDPAV LRRISADLAG RSALIADGHH RYAAYRRLRA 
AHDAPGWRYG LALLVDSDTH PPRLGAIHRV LPGLDTDAAV EAARTVASVE RVAGPRAHAL 
DRAEAPALLL VSPEGDAHLV HGFDERVLER AMPDRSPQWR HLSTAALHQV LLPLWEVPEE 
RVRMVHDDAA EAVAAARDEK GTAVIVPALR VEQVYAVADR GELTPRKSTS FGPKPRTGLV 
MRLLD