Gene Ndas_5521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5521
Symbol
ID	9249424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	711937
End bp	713751
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	71%
IMG OID
Product	TRAG family protein
Protein accession	YP_003683406
Protein GI	297564433
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.197372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.646541
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGGC GCAGACCCAC GTACCAGGTG CGCGGCGGAG CGGCGGCGGC CGGAGCCCCG 
CCGCTGCTCG TGCTGCTCGC CCTGTGGGGC CTGGTGGCCC TGTTCTTCCT CTTCTGGCTG 
TCGGCGCGGC TCGTGGCCGC CGTAACCGGG GGCGCGGTCG GCGAGTTCGG CCCGATGTGG 
GCGTACTCGC TGCTGGTCTG GGACACCGGG GCGACCTGGC CGGGCACGCC GAGCGCCCCG 
GTCGCCGTGG TGTTCTCCGT CCTGGCCGCG GCTGCGGTCA GCGCCCTCTG GTGGATCCTG 
GTCCGGGTCA GGAACGCGCT GTACGGACAG CCCGACGCGG TCGCCGCCCT GAACAGGAAC 
AACGAGACGA TCGCCGAGCT GGCCCGCCCC GAGGCCGCGC AGAAGGCGGT CCGGCTGCGC 
GGACGTTCGC TGCGCGGCAT CAGGAGCGGG ACGCTCGCCG ACGCCGACGT CGGCCTGGTC 
ATCGGCGACG TGCGGGGGTC GGGCAGACGC GACGGGCCCC GGCTGTTCGC GTCGTGGGAG 
GACACCGTCC TCGCCTACAT GGCGCCCCGC GCGGGCAAGA CCACGGCGAT GGCCATCCCC 
TACGTCCTGG ACGCGCCCGG TCCTGCGCTG GCCACCAGCA ACAAGGCCGA CGTCTGGTCG 
GCCACGGCGA AGATCCGGGA GCAGGCCACC GGCGACCGGG TCTGGCTGTT CGACCCCCAG 
CACATCACCC ACCAGGAGCA GGACTTCTGG TGGAACCCGC TGGCCGGTGT GCGCAGCGTC 
GAGGACGCCT ACCGGCTCGC CGGGCACTTC GTCCTCACCA TCGACGACGA CTCCAAGAAG 
GACATGTGGG GTCCGGCGGC CCGGGCTCTG CTCTCCCAGC TCATGCTCGC CGCGGCGCTC 
GGGGGCGAGT CCCTGGCCAG GGTCGGGGAG TGGCTGCACG ACACCAAGCT GCCCCAGCCG 
GTGGACATCC TCTTCGAGCA CGGGTTCACG GCCTACGCCG AGGCACTGCG CGAGACGCAG 
AACATCGTCG CCGAGACGCG TGACGGCATC TACACGACCG CACGCACCGC CGCCCGCTGT 
CTGGACGACC CCGAGATCAT GGCGTGGGTG ACCCCGCCGG ACGGCTCGGC TTACCACGAG 
TTCGACCCGC GCTCCTTCGT CACCACCAAA CAGACGCTCC ATCTGCTCAG CAAGTCCCGC 
GCCGCCGCGG CCCCGCTCAT CGCCGCCCTC ACCGACGCGG TCTTCATCGC GGGAGAGGAG 
GCGTCGGAGG GGCAGGGCGG CAGGCTCGAC CCGCCGCTGG TGGCCGTGCT GGACGAGGCC 
GCCAACATCT GCAAGATCGC GGACCTGCCC GACATGTACT CCCACCTGGG ATCGCGCGGC 
ATCGTCCCGG TCACCATCCT CCAGAGCTAC CGGCAGGGGG TGCGGGTCTG GACCGAGAAC 
GGCATGGAGG CCATGTGGTC CGCCGCCACG GTGAAGGTGT TCGGCGCCGG GCTCGACGAC 
CACAAGATCG TGGACGCGCT GTCCAAGCTG ATCGGCCAGC ACGACATCTC CACCACGTCG 
TTCAGCTACG GCGAGGGCAA GGGCAACCAC TCCGTCCAGC TCCGGCGCCA GGAGATCATG 
CAGGGCTCCG ACATCCGCAG GATCGACAAG GGCGAGTGCC TGCTCTTCGC CACGGCCGCC 
CAGCCCACGA TCCTGCGGAT GCGCCCCTGG TACAGGACCG ACAGGGCCAG GATCGTCTCC 
GCCGCGATCA AGGAGGCCGA GGAGCGGATC ACCACCAGGG CCCGCGTGCG CTACGACGCG 
CCCCGCGGAA GGTGA

Protein sequence

MARRRPTYQV RGGAAAAGAP PLLVLLALWG LVALFFLFWL SARLVAAVTG GAVGEFGPMW 
AYSLLVWDTG ATWPGTPSAP VAVVFSVLAA AAVSALWWIL VRVRNALYGQ PDAVAALNRN 
NETIAELARP EAAQKAVRLR GRSLRGIRSG TLADADVGLV IGDVRGSGRR DGPRLFASWE 
DTVLAYMAPR AGKTTAMAIP YVLDAPGPAL ATSNKADVWS ATAKIREQAT GDRVWLFDPQ 
HITHQEQDFW WNPLAGVRSV EDAYRLAGHF VLTIDDDSKK DMWGPAARAL LSQLMLAAAL 
GGESLARVGE WLHDTKLPQP VDILFEHGFT AYAEALRETQ NIVAETRDGI YTTARTAARC 
LDDPEIMAWV TPPDGSAYHE FDPRSFVTTK QTLHLLSKSR AAAAPLIAAL TDAVFIAGEE 
ASEGQGGRLD PPLVAVLDEA ANICKIADLP DMYSHLGSRG IVPVTILQSY RQGVRVWTEN 
GMEAMWSAAT VKVFGAGLDD HKIVDALSKL IGQHDISTTS FSYGEGKGNH SVQLRRQEIM 
QGSDIRRIDK GECLLFATAA QPTILRMRPW YRTDRARIVS AAIKEAEERI TTRARVRYDA 
PRGR