Gene Ndas_3975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3975
Symbol
ID	9247846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4754391
End bp	4755515
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	71%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681878
Protein GI	297562904
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.125368
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACAGGG GACCGGTACG GGCACTGGCG ACGACGGGGG CACTGACCCT CGTCCTGACA 
CTGGTCGGAG CGGGGGACGC CCCGGCGGGC GGGGCCCCGT CCTCTCCACG GCAACCCTCG 
GACCGGCCCG CGGGGGTGAC GGAGCCGCCC TGGCGCTGGG GGTACGCCAC CGACGAGGAG 
TGCACCGTCT CGGAGATCCT GGAGCCCTCG TGCGGCGTCT GGTGGGGGGC CAGCCCCTAC 
CAGGACCGGA TCGAGCCCCT GGAGGAGGCG GTCGACCGCC GCATGGACAT CGTCTACACC 
TGGCGCGGCG TCGACCAGGC CAACATCCCC GGCAGGCGCG AGCGGGAGCT GATCGCCGAG 
GGCAGGTTCG TGCACACCAA CATCGAGGCC CGGCGGTTCA CGCGCTCCGG GCATCCGGCG 
GTCTCCTACG AGTCCCTCAT CGACGGCGAG TTCGACGACT CGCTGCGCTC CCAGGCCCGC 
GCCGTCGCGG AACTGGACGT GCCCTACTTC GTCACCTTCG ACCACGAGGC CGACGCCAAC 
ACGCGCTACA ACAGGCGCGG CACGCCCGAG GAGTTCGTGC GGGCCTGGCG GCACATCGTG 
GACCTGTACC GCGAGGAGGG CGCGGACAAC GCCATCTGGG TGTGGAACGT GACCGGCTGG 
GAGGGCAACT TCGACCGCCT CCCCGGCCTG TGGCCCGGCA ACGACTACGT CGACTGGGTC 
AGCTGGGAGG CGTACAACAT GACCGGCTGC GACTCCCAGC CGCACTGGGA CGAGGTGTAC 
TCCTTCGAGG ACATGATGCG CCCGGCCTAC GAGTGGTTCC AGAACGAGGG GCCCGACCAC 
GGGATCGACC CGGACAAGCC GGTGATGATC GGGGAGATGG GCACCACGCC CATCGGCTCG 
CAGGAGACCC TGGAGTGGTA CTCCGAGATC CCCGACGTGC TGCGCCGCTA CGAGCGGGTG 
CGCGCGGTCA AGGTGTGGGA CAACAAGCTG TCCCCGGACT GCGACTTCCG GATCCGGGCC 
AACGAGTACG CCCAGCGCGG CTTCGAGGCC GCCGGACAGG ACCCGTACGT GTACCTGCCC 
GAGCGGGTGC GCCGCCTGGC CGAGTACGCC CAGCAACGGG GTTGA

Protein sequence

MDRGPVRALA TTGALTLVLT LVGAGDAPAG GAPSSPRQPS DRPAGVTEPP WRWGYATDEE 
CTVSEILEPS CGVWWGASPY QDRIEPLEEA VDRRMDIVYT WRGVDQANIP GRRERELIAE 
GRFVHTNIEA RRFTRSGHPA VSYESLIDGE FDDSLRSQAR AVAELDVPYF VTFDHEADAN 
TRYNRRGTPE EFVRAWRHIV DLYREEGADN AIWVWNVTGW EGNFDRLPGL WPGNDYVDWV 
SWEAYNMTGC DSQPHWDEVY SFEDMMRPAY EWFQNEGPDH GIDPDKPVMI GEMGTTPIGS 
QETLEWYSEI PDVLRRYERV RAVKVWDNKL SPDCDFRIRA NEYAQRGFEA AGQDPYVYLP 
ERVRRLAEYA QQRG