Gene Ndas_4028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4028
Symbol
ID	9247900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4820534
End bp	4822771
Gene Length	2238 bp
Protein Length	745 aa
Translation table	11
GC content	73%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681931
Protein GI	297562957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.304691
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAACAGA CCAATCACAA CTTCCTCAAC GGAGGAGGTC AGGCGGGGAT CTCCGACCGC 
ATGCGTGACC TGCTCTCCCA GGCCGCCCAG GAGCACGTCT CCGAGCAGAA GTCGCAGGGC 
GCCGTCAGCG AGGAGATGCG CCAGCGCCTG GAGGGCATGG AGTGGCTGCT CCGCGAGCTG 
CGCGAGCGCG AGCTCACCGC CCTCACCGAG TCGGTCGCCA CGGTCAACGG CCGCGTCGAC 
GAGTTCCTCG CCCGGCCGCC GGAGTGGGCG GAGACCCTCG CCGAGCACAT CGAGGTCGTC 
GCCCAGCAGG TCAAGCCCCT CTCGGACCTG CCCTCCCTGC GCGCGGACAC CCACCGCATC 
GCCGGTCACC TGGACACCGC GCTCACCCGC CTCCAGCGGA TGGCGGAGAC GGGCAACCGC 
ACCTCCGAGC AGGTCAACGA GCTGGGCGAG CGCCTGACGG GGCTGGACGA GAGCCTCGAC 
ACCCGTCTGA ACGGACTCGG AGAGACCCTC GGCGCCCGCC TGGACGGGCT GAGCGAGACC 
TTCGGCGCCC GCCTGGACGC GCTCGACACC GCGCTGGCCT CCCTGACCGC CAGGACCGAG 
GCCGTGCAGG CGTCGCTGTC CGCGCTCTCG GAGTCGGCGG AGAGCCGCCA CGAGGCCCTC 
ACCGCCGCGG TCGGCGAGAG CCGCACCGAA CTGGCCGAGG CGCTCGCCGG CGGGCGGACC 
GAGATCTCCG AGGCCCTGGC CGAGGGCCGC ACCGAGCTGG CAGAGGCCGT GGCCGCGAGC 
CGCGAGAGCC TCACCGCCGT CGTCAACGAG AGCCGCGAGA GCCTCACCGC CGTCGTGAGC 
GAGAGCCGCG AGGCCCTGGC CGCGGCCGAC GCCCGGCTGG GCGAGACCGT CGAGGCCAAG 
GCCGAGGAGG CCGCCGCCAG GGCGGAGCAG GCCAACGGCG AGCTGCGCAC GCTCGTGGAG 
GAGCGCACCG AGCGTCTGCG CACCTCGATG GAGGAGCGCA CCGCCGAGCA GCACGAGACG 
CTGCTGTCGC GCCTTCAGGA GAACACCGGC GAGCTGGGCG AGCGCACCGC CGCCCTGACC 
GAGGAGCTGG GCGCCCTGTC CACCTCCTCC GCCGAGCGCC ACGAATCCCT CACCGCCAAG 
CTGGCCGAGA GCGTCGGCTA CCTCAGCACC CAGGCCGAGG AGAACAACGC CGAGACGACC 
GCCGCGGTCG CCGACGTCAC CGGCGCGCTC GCCAAGCTCC GCGAGGACCA CGAGTCGTCG 
CTCACCGAGC TGCGCACCCA CCTGCGCCAG CGCCTGGCCG AGCTCAACGA GCAGATGGAG 
CTGGGCCGCA CCGAGACCCG GGAGCAGGCC GAGGCCGCCT CCGAGCGCCT GCGCGAGGCG 
GTGACCGAGC GCACCGACGC CCTGGGCGCC CGGATCGCCG AGGACGCCGA GCGCGTCACC 
TCCGACTTCG CCGAGCTGCG GACGTTCGTC CAGGAGAACG GCGACCGGCT CGCCACCGAG 
TCCGAGGAGC GTTCGCGGAC GCTGACCGAG TCGCTCACCG AGCGGGTGGA GGCGCACCGG 
ACGGCGCTGG ACGAGCGTCT GGAGCGCCAG CGCGAGGCCC TGACCGGCAA GGTCGACACC 
CACCTTGCGC AGATCACCGG CAAGGTGGAC CACGAGCTGG GCCGCCTCAC CGACCGCTTC 
GACACCTTCG AGGGGCACTT CGAGGGAAGC TTCGAGGGGG TCGAGGGCAA GCTCGACCGC 
ATCGACGGCC GCATGGACGG CGTCAACGGC CGCCTGGACG GCCTGGACGG CCGGGTCAAC 
GGTGTCGAGG GCCAGTTCGA GGGCGTCAGC GGGCACTTCG AGGGCGTGGA CGGCCGTATG 
GAGGCCCTCG ACGACCGGCT GGAGGCGCTC AACCAGCGGC TCAACCAGCT GCCGCAGACC 
ATGGAGGTCA GCGAGCTGCA CCGCCGCCTG ACCGAGCTGG TGGAGCGGCC GCAGCTGGAC 
CACACCGGCA AGCTGGACGA GATCGACGAG CACGTCACCT CGGCCGTGGC GCCGGTGCTG 
CGCGAGCTGA AGCAGCGCCC GGACCGGCAC GAGCTGGAGG AGACCGTCAC CGAGGCGGTC 
GAGAACTCGC ACGACGACAT CACCAAGCGG TTCGCCTCCC TGGAGGAGAC GGTGCTCGCC 
CTGGCCGAGG CGCTGCTGCG CCCCGGCCGG GACGGCAAGA AGAAGCGCCG CCGCGACGAG 
GACGAGGACG ACGAGTAG

Protein sequence

MEQTNHNFLN GGGQAGISDR MRDLLSQAAQ EHVSEQKSQG AVSEEMRQRL EGMEWLLREL 
RERELTALTE SVATVNGRVD EFLARPPEWA ETLAEHIEVV AQQVKPLSDL PSLRADTHRI 
AGHLDTALTR LQRMAETGNR TSEQVNELGE RLTGLDESLD TRLNGLGETL GARLDGLSET 
FGARLDALDT ALASLTARTE AVQASLSALS ESAESRHEAL TAAVGESRTE LAEALAGGRT 
EISEALAEGR TELAEAVAAS RESLTAVVNE SRESLTAVVS ESREALAAAD ARLGETVEAK 
AEEAAARAEQ ANGELRTLVE ERTERLRTSM EERTAEQHET LLSRLQENTG ELGERTAALT 
EELGALSTSS AERHESLTAK LAESVGYLST QAEENNAETT AAVADVTGAL AKLREDHESS 
LTELRTHLRQ RLAELNEQME LGRTETREQA EAASERLREA VTERTDALGA RIAEDAERVT 
SDFAELRTFV QENGDRLATE SEERSRTLTE SLTERVEAHR TALDERLERQ REALTGKVDT 
HLAQITGKVD HELGRLTDRF DTFEGHFEGS FEGVEGKLDR IDGRMDGVNG RLDGLDGRVN 
GVEGQFEGVS GHFEGVDGRM EALDDRLEAL NQRLNQLPQT MEVSELHRRL TELVERPQLD 
HTGKLDEIDE HVTSAVAPVL RELKQRPDRH ELEETVTEAV ENSHDDITKR FASLEETVLA 
LAEALLRPGR DGKKKRRRDE DEDDE