Gene Ndas_4123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4123
Symbol
ID	9247997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4924976
End bp	4926574
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682024
Protein GI	297563050
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.433169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCCT CACGCCCCGA GACCGGCGGC ACGCCCGAAC CGGTCCGCCA GTCCCCCACC 
GACGCACAGC CACCCTTCGT CCCCGCCCAG AGGCAGGCCG CTCCCCCCGA GGCCGAGGCC 
GCCTCCGGTA CGGCCGCTCC CGGCGGCGCT CCGCCCGAGG AGCGCGTGTG GAAGGCGGGC 
CGGCTGGAGC CGATGCCCAT CCGCCCCCTG CCCAAGGCGC CGCCCTCGAT CCACATCCTG 
GGCCCCACCG TGTTCCTCGT CGCCCTCGGC GTGGGCATGG GCGAGTCCTA CATGTGGCCG 
AGGCTGGTCC TCGTCTTCGG CCCCGAGATC CGCTGGCTGT TCCTGGTCGG CGTCACCCTC 
CAGGCCGTGG TCATGCTGGA GATGTCGCGC TACGCGATGG CCACCGGGGA GAGCATCTTC 
TACGGCGCCG CGCGCGTGTT CAAACCGCTC ATGTGGTTCT TCTTCATCAC GGCGATGCTG 
GTCTACATCT GGCCGGGCCA CCTCTCGGCG GGCGCCTCCG CCTTCGAACG GGTGACCGGC 
ATCCCCTGGC AGGCCACGGC GGTCGCCGGG ATGCTCCTCG TCGGTGTGGT GTTCACCCTG 
GCGAAGGTCA TCTACAACCT GCTGGAGAAC GTGCTGTCGA TCTGCATCGG CATGCTGGTG 
GTCGGCAGCG CCGTGATCGC GGCCATCGTG GGCGACCTGT CCGACCTGAC CTCCACCCTC 
ACCGGGATGT TCGCGTTCGG CTACCTGCCG GAGGAGGCCA CCACGGCCCT GTGGTTCCCC 
GTGATCGTGG GCTCCATCGC CTTCGCCGGG CCCTCGGGCA TGCAGCAGAT GTGGTACACC 
CTGCACCTGC GCGACAAGGG CGCCGGGATG GGCTCGCACA TCCCCAAGAT CCGGGGCCTG 
CGGCACGCGG GCGAGCAGGA GGCCATGCCC ACGCGCGGCT TCATGTTCGA CACCTCCGAC 
GCCTCGGAGA TGGAGAAGTG GAAGGGCTGG CGGCGCTGGG TCACCTTCGA CGCGATGGTC 
CTGTTCTGGG GCATCACGAT GCTGGTGACG ATCTCCTTCA CCGTGCTGGC CCAGGCCTCG 
GCCCGCTTCG ACCCGAACGT GACCGACCTG CTGCGCGACG GCGACCGCGA CGCCGCCCTG 
GACGCCATGG CGGCCTCCTT CTCGGCGGCC GGGAGCCCGG TCCTGGGCAC GGTGTTCTTC 
TGCTTCATCG CGCTCATCGG CCTCAACGCC ACGCTGGGGC TGTTCGACTC CTTCTCGCGC 
GGCCAGGCCG ACATGACCTT CAACTTCGTG CCGGGCGCCA AGAAGGTCGG CATGTCGAGG 
CTGTACGCCC TCTTCCTGTG GGGCCTGATC GCCTTCGGCA TCGTCATCCT GCTCTTCGGC 
CCCGCCGACG GCCCGGCGGC GATCCTGGAC GTGCTGGCCT TCCTGTCGGC GTTCGCGATG 
GGCGCCTACT GCGTGGTGCT GCTGCTGGTC AACAACCTCA CCCTGCCCAA GCCGATCCGG 
CCGGGCATCC TCTCCAACGC CGTCATCGCC TTCGCGGCGG TGTTCTACCT CGGCGCCCTG 
TTCTACTCGC TGTTCGCCTT CGGGGTCGTG ATCGACTGA

Protein sequence

MDSSRPETGG TPEPVRQSPT DAQPPFVPAQ RQAAPPEAEA ASGTAAPGGA PPEERVWKAG 
RLEPMPIRPL PKAPPSIHIL GPTVFLVALG VGMGESYMWP RLVLVFGPEI RWLFLVGVTL 
QAVVMLEMSR YAMATGESIF YGAARVFKPL MWFFFITAML VYIWPGHLSA GASAFERVTG 
IPWQATAVAG MLLVGVVFTL AKVIYNLLEN VLSICIGMLV VGSAVIAAIV GDLSDLTSTL 
TGMFAFGYLP EEATTALWFP VIVGSIAFAG PSGMQQMWYT LHLRDKGAGM GSHIPKIRGL 
RHAGEQEAMP TRGFMFDTSD ASEMEKWKGW RRWVTFDAMV LFWGITMLVT ISFTVLAQAS 
ARFDPNVTDL LRDGDRDAAL DAMAASFSAA GSPVLGTVFF CFIALIGLNA TLGLFDSFSR 
GQADMTFNFV PGAKKVGMSR LYALFLWGLI AFGIVILLFG PADGPAAILD VLAFLSAFAM 
GAYCVVLLLV NNLTLPKPIR PGILSNAVIA FAAVFYLGAL FYSLFAFGVV ID