Gene Ndas_4574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4574
Symbol
ID	9248455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5419053
End bp	5421452
Gene Length	2400 bp
Protein Length	799 aa
Translation table	11
GC content	68%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682467
Protein GI	297563493
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTTTCG AGCCCACCGA GCCCCAGAAC GGCGTGGACC CCAACCCGTT CACGCTCATC 
GACCCCGACA CCATCCCCTA CCCCCTCACC GACGTCTGGT CCCTCAACTA CGCGGCCGAG 
ACCCTGCGCA CCGGCGGGGA GGACCTCTTC GGCGGGGCCG AGGACATGTC CTCCACCTGG 
GGAGGGCTCC AGGCCCACTA CAGCGCACCG GAGAGCGAGA CGCTCTTCGC CGCGATGGAC 
CCCGTCCTCA CCCGGGGAGA GGGCCTCCAG GGCGACCTCG CCACCGTCGC CAGCGCGCTG 
GAGGACCTGG CCGAGGCGGC CACGACCGCG CGCGGTTCGC TCAACACCCT GCGGATCGAC 
GCCCAGAGCC TGTGGAACGC CAACCACGAC AAGAAGGTGT GGTGGCTGAA CAAGGACGAC 
GAGACCGACG AGTGGGCGCT GGCGGAGAAC ATCCGCATCA AGGACGCGGT CAACACGGCC 
TGGTCCACGT TCAACGAGGC AGAGAACGCC TGCGCCACCC GGATCTCGGC GGTGTTCGGC 
GGCCCCGCCT ACGTGTCCCC GGACCAGGCC GCCGGGGACG GAGCGCTGGT CTACGGGCTG 
CCCACCGACG CCGGTGAGCG CGACCTGTCG CTGGAGAACG CCCTGAGCTT CGAGGGCGTC 
AACAGCAACA TCAACGACTT CGCCGCGTGG GCGGGCAGCG AGTTCCACCC CTCCCTGATG 
GACTGGGGCA ATCCCATCGG CCAGGCGCTG TGGGACACGG GGGCCACCGA CTTCCTGTGG 
GGGACGGCGG TGGGGCTGAC GTCCAAGCTC GGGTTCTGGC ACCCCGACAA CGGGTGGCGG 
TTCGATCCGC GGGGCCGCTG GGACAACGCC ACGGCGGCCT GGGGCGACGC GTGGATGGAC 
ACGGCCACCC TGGTCGGTGT CCACGACGAA CACGGGTGGC TGTGGGAGCC GGGCGAGGGC 
GGCCAGGAGG GCTGGGGCGC CGGATGGGAC CGGTGGACCG GCAACGCCTG GGGCAGCCTC 
ACCGAGATTT GGGAGGGGCA CACCGCCTGG TCCACGCGGG ACGACGGCGT CGCCTACTCC 
AACACCACCA TCGGCGCCAA CGCCGCGCTG ATGACCGTCG GGTTGCCCCT CAAGGCTCTC 
AAGATCATCG CCGGGGCGGG GGTGGTCAGC TCCATGGACG CCCCCGGGGG TTCGGGTGAC 
GCGGAGTTCG ACGGCTCCGG CCCGGGTTCC GGCGGGGGCT CGGGCTCGGG CTCGGACAGC 
TTCACGTCGA GGGGCGGGCC GGGAACGCGT GGCTGGCCCA GCAGCCCGCT TCCGGGCGCC 
GGGGAGGGGC AGCGCCCCAC GGGGGAGCGC TTCGAGAACC CGCTCACCCA ACTGAACGAG 
TCGTTGCTGG ACCCCGACCG GTACCGTCCG CCCGCCTCCA CCCCGACCAC CCCCGTGCCC 
GACGGTGGCG GGGACCGGCC CTCGCAGAAC CCGCCCGCGC CGCAGCCCCA GGACAGCGGC 
ACCCCCCGGA ACCGACCGGG CGACGAGGAC ACTCCGCGGC GTTCTGACGA GGAGGACACG 
GAGGTACCGG GAGGGCCCGA GGAGAGGCCC GGCGCCCCGG CCCCGACGCC GCGTCCGGAG 
GGCGAGTCCC AGCGCGGCGA CACCGACGCG CCCCGCGCCG AGGACGACGA GAGCGACCGG 
AGCGATGCGG GAGAGGGCAC GGCTGGTCCG CGCGAGGAGC CGGAGGCGGA GCGTCCCGAG 
CCCGCCGCCG GTGGCGGCGG CGGGGGCGAC GAGCCCCCCA ACGACCGCAC CGGTACCGGT 
GGCGATGATG GTGATGAAGG CGGCCCCGAC AACGGTCGTG ACAACAACGA TCAACCTCAG 
AAGCCTCAAC CAGATAACGG AGATGATTCG CAAGGTAGTC AGGAACGGCT TTTGGATGCC 
TTTCCGGATA GAGTCGATAC GGAAGGTCTC CTTCCGCGTC CGGACCAGAC CAAGCCGCCA 
ACTGGACGCG CCAACCCGAG GTCATTTGAA GATATTGCTA GCGAAGGGCT TGTTGGCCCT 
GAATGGAAGC ACTTCAGTGA TAAAGAAGTA AGGGTGGCAG AATATCTCAG AGAGCATGGC 
ATTGAGGTTG AGTCCATTAA GGAGTCGACC GTTGACGGAG TTAGGACTCC GGAGGCTGTA 
ATATCCGGCA CTGGTGAGAC GGTCGAGTTC AAAGTCCTCG AATCAGATAC TGCAAGATCT 
TTCGAGCGGA ACATTAGGAA CGCGAGGGGG CAGTCTCGCC GGATGGTTTT TGATGTGAGG 
CACCTGGGGA CTTCTCAAGA GGATGCCGTT AAGAGGATTG GGAGTGGGCT GTTCAACTAT 
GGAGGAGACC TCAGTGAGGT AGTTGTAATT GGTGACGGGT ACACTATCGT TTGGCCGTAG

Protein sequence

MSFEPTEPQN GVDPNPFTLI DPDTIPYPLT DVWSLNYAAE TLRTGGEDLF GGAEDMSSTW 
GGLQAHYSAP ESETLFAAMD PVLTRGEGLQ GDLATVASAL EDLAEAATTA RGSLNTLRID 
AQSLWNANHD KKVWWLNKDD ETDEWALAEN IRIKDAVNTA WSTFNEAENA CATRISAVFG 
GPAYVSPDQA AGDGALVYGL PTDAGERDLS LENALSFEGV NSNINDFAAW AGSEFHPSLM 
DWGNPIGQAL WDTGATDFLW GTAVGLTSKL GFWHPDNGWR FDPRGRWDNA TAAWGDAWMD 
TATLVGVHDE HGWLWEPGEG GQEGWGAGWD RWTGNAWGSL TEIWEGHTAW STRDDGVAYS 
NTTIGANAAL MTVGLPLKAL KIIAGAGVVS SMDAPGGSGD AEFDGSGPGS GGGSGSGSDS 
FTSRGGPGTR GWPSSPLPGA GEGQRPTGER FENPLTQLNE SLLDPDRYRP PASTPTTPVP 
DGGGDRPSQN PPAPQPQDSG TPRNRPGDED TPRRSDEEDT EVPGGPEERP GAPAPTPRPE 
GESQRGDTDA PRAEDDESDR SDAGEGTAGP REEPEAERPE PAAGGGGGGD EPPNDRTGTG 
GDDGDEGGPD NGRDNNDQPQ KPQPDNGDDS QGSQERLLDA FPDRVDTEGL LPRPDQTKPP 
TGRANPRSFE DIASEGLVGP EWKHFSDKEV RVAEYLREHG IEVESIKEST VDGVRTPEAV 
ISGTGETVEF KVLESDTARS FERNIRNARG QSRRMVFDVR HLGTSQEDAV KRIGSGLFNY 
GGDLSEVVVI GDGYTIVWP