Gene Ndas_4909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4909
Symbol
ID	9248796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	39216
End bp	40448
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	68%
IMG OID
Product	transposase, IS605 OrfB family
Protein accession	YP_003682798
Protein GI	297563825
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.646541
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACA AGAGCGTGAA GCGGGCGTTT CGGTACCGCT TCTACCCGAC CGATGCGCAG 
GCGGCCGAGC TGTCGCGCAC GTTCGGATGC GTGCGCCTGG TCTACAACCG CGCTCTGGTC 
GAACGCAGCA CCGCCTGGCA CCAGCACCAG GAACGGGTGG GCTACTCCCA CACCTCGACC 
ATGCTCACCG CATGGAAGAG GACCGAGGAG CTGTCCTTCC TCACCGAGGT CTCCTGCGTC 
CCGCTGCAAC AGACGCTGCG CCACCTGCAC ACCGCCTTCC GGAACTTCTT CGACCGTCGC 
GCGCGGTATC CGCGGTTCAA GTCCAAGAAG AAGTCGCGTG CCTCGGCGGA GTACACCCGG 
TCCGGGTTCC GCTACCGCGA CGGCCACCTG ACCCTGGCCA AAATGAGCGA AGCCCTGGAC 
ATCGTCTGGT CGCGGCCCCT GCCCGAAGGG GCACGGCCGT CCACGGTGAC GGTCTCGCGG 
GACGCGGCCG GACGCTGGTT CGTCTCGCTC CTGTGCCAGG ACACCATCAC GTCGGCCCCG 
GCCGTCAACA ACGCGGTCGG CGTCGACGCC GGAATCACCT CCGTGGTGAC GTTGTCGACC 
GGGGAAAAAG TAGCCAACCC CCGCCACGAG CAACGCGACC GCGCCAGGCT GGCCCGCGCC 
CAGCGGGCGC TGGCCCGCAA GGCCAAGGGC AGCGCGAACC GGGACAAGGC CCGCCGGAAG 
GTGGCGCGGG TGCACGCCCG CATCACCGAC CGCAGGCGCG ACTTCCTGCA CAAGCTCACC 
TCCCGACTCG TCCGCGAGAA CCAAGTGGTC GTGATCGAGG ACCTGACGGT GCGCAACCTG 
GTCAAGAACC GCAGGCTCGC CCGGGCGATC TCGGATGCGG CCTGGCGTGA GCTGCGCACC 
ATGTTGGAGT ACAAGTGCGC CTGGTACGGA CGCGACCTGG TCGTGGTGGA CCGCTTCTTC 
CCCTCCTCCA AGACGTGCTC GACCCCCGGA TGCGGGTACG TGCACGCGTC GCTGCCGTTG 
AACGTGCGGG AGTGGACGTG CCCCGGGTGC GGGATCACTC ATGACCGTGA TGTGAATGCG 
GCGAACAATC TCGAAGCCGC CGGGCTGGCG GTTGTTGCCT GCGGAGCTGG TGTGAGACCT 
CAACGGGAGT CCTCCCGGAC GGGGCGACCG GCGACGAAAC AGGAAGGCCA CGGGGCGACC 
CGTGACGAGG CATTGGCCTC GAACCACCGG TAG

Protein sequence

MTNKSVKRAF RYRFYPTDAQ AAELSRTFGC VRLVYNRALV ERSTAWHQHQ ERVGYSHTST 
MLTAWKRTEE LSFLTEVSCV PLQQTLRHLH TAFRNFFDRR ARYPRFKSKK KSRASAEYTR 
SGFRYRDGHL TLAKMSEALD IVWSRPLPEG ARPSTVTVSR DAAGRWFVSL LCQDTITSAP 
AVNNAVGVDA GITSVVTLST GEKVANPRHE QRDRARLARA QRALARKAKG SANRDKARRK 
VARVHARITD RRRDFLHKLT SRLVRENQVV VIEDLTVRNL VKNRRLARAI SDAAWRELRT 
MLEYKCAWYG RDLVVVDRFF PSSKTCSTPG CGYVHASLPL NVREWTCPGC GITHDRDVNA 
ANNLEAAGLA VVACGAGVRP QRESSRTGRP ATKQEGHGAT RDEALASNHR