Gene Ndas_5431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5431
Symbol
ID	9249334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	617126
End bp	618460
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	73%
IMG OID
Product	protein of unknown function DUF571
Protein accession	YP_003683316
Protein GI	297564343
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.55205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGGAT ACTGCCGGGT CACGGTGACC GGACCGGAAC GCTGGGCCGA TCTGGCACTT 
CCCGGAACGG TTCCCGTGGC CACACTGATG CCCCGCATCC TGGAGGTCTG CGCACCCGAG 
GAGGAGGGCA CCGAACCCGC CGCGTGGACG CTCACCACCG TGGAGGGCGA CCCCGTCCAC 
CCCGACCAGC CGCTGGAGAG CGCGGGCGTC TACGACGGCG ACGTGCTGGT GCTGGACCGC 
CGCACCGCGC CGGGCAGGCC CGCGCACGTG GACGACGTCC GCGGCGCGGT CGAGGACCGC 
GTCGACGCCA CCGCGCACAT CTGGAACCCC ACGACCACGC TGTCCTTCGG CCTCCTCGTC 
GCGGCCATCG GCCCCCTGCT GCTGCTCGGG CTGATGACGC GGCTGAGCCC GTCCGCCTGG 
CACCTGGGGA TCGCCTCGGC GGGAACCCTG TTCACGGTCG CGGTCATGCT GCTCGCCGCG 
CGCAGGCCGC TGCCCGCCGT CGCGCACGTG CTGTTCACGA CGGCCTGCGC GTGGGGCGCG 
GTCACCGCCG TGCTCGCCGC GAACCTGCTG ACCGACGCGA ACTTCCTGGT GCAGGCGGCC 
TTCGCGCTCT CCGGCGCCCT GCTGGTGGCG GTGATCGGCT GGACGATGCA CGAGACGGGG 
CTGGCCTACA TCTGCGCGCT CGGCGTGCTC GCGGTGACGG CCGGAGTGCT CGTGGTGGTG 
GGCGTCTTCG TGGAGCCGGT GCAGGGGGCG CGGTCCATGG GGCTGGTCCT GGCACTGTGC 
GTGGGCGCGC TGCCGCGCGT GGCGATGGTG ATGGGCGGGC TGTCCGGGCT CGACTACGAG 
GTGGGGCGCT CGGGGCAGGT CACCACGGAC CGGTTCGAGG ACACCTTCGG CAACACCGAC 
CGCATCCTGT TGGGCGTCGT GCTGGGCGCG GCGGTGAGCG GCGGCGCGAC GACCGTGCTG 
CTGGCCTACC TGGCCACGGG CCTGCCCGAC CTGCTGCTGT GCGCGCTGCT CTCGCTGCTG 
CTGGTGCTGC GCTCGCGGCT GTTCGACCGG ATCCGGCACG TGCTGCCGCT GCGCCTGGCG 
GGGGTGCTGG GCCTGGGCGC GGCGGGTGTC GCGACGGTCG GCGAGTACGC CTTCCTGGCG 
CCGTGGCTGC CGCTGGTCGC GCTCGTGGCG GGGATCGCTC TGGGAGTGCT GAGCTGGGTG 
CGGCTGACCG ACGTGCCGCG TGCCTCGCTG CGCCGCCTCC TCAACTGGAC GGAGATCCTG 
GTGATCATCG CGATGTGCGC GGTGTTCGCC TGGGGGATGG GCCTGTTCGC GTTCGTGGAG 
CGGATGACCT CGTAG

Protein sequence

MSGYCRVTVT GPERWADLAL PGTVPVATLM PRILEVCAPE EEGTEPAAWT LTTVEGDPVH 
PDQPLESAGV YDGDVLVLDR RTAPGRPAHV DDVRGAVEDR VDATAHIWNP TTTLSFGLLV 
AAIGPLLLLG LMTRLSPSAW HLGIASAGTL FTVAVMLLAA RRPLPAVAHV LFTTACAWGA 
VTAVLAANLL TDANFLVQAA FALSGALLVA VIGWTMHETG LAYICALGVL AVTAGVLVVV 
GVFVEPVQGA RSMGLVLALC VGALPRVAMV MGGLSGLDYE VGRSGQVTTD RFEDTFGNTD 
RILLGVVLGA AVSGGATTVL LAYLATGLPD LLLCALLSLL LVLRSRLFDR IRHVLPLRLA 
GVLGLGAAGV ATVGEYAFLA PWLPLVALVA GIALGVLSWV RLTDVPRASL RRLLNWTEIL 
VIIAMCAVFA WGMGLFAFVE RMTS