Gene Ndas_2587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2587
Symbol
ID	9246438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3080754
End bp	3081779
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_003680511
Protein GI	297561537
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.969826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0068543
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGTGC CGATGGACGC GCCCGAGTCC TCCCAGCACG CCGACCCCGA GGCGGCGGCC 
GCCGGAGGAC GCGGGTCGGC GAACAGGTCC CTGCGCCAGA TCGCCTGGCG GCGCTTCCGC 
AGGGACCGCC TCGGCATGGC CGGGGGCGTC GTCGTCATCC TGCTCATCCT GGTCGCGGTC 
TTCGCGCCCC TGCTCACCTC CTGGTTCGGC TACCCGCCCA ACCAGTTCAA CCAGGAGCTG 
ATCGACCCGC TCACCGGCGG CGTCCTGCGC GACCCCGCCG ACCCCTCCCT GGGGCTCGAC 
CCCTGGGGCG GTATCAGCGC CGACCACCTG CTCGGCGTGG AACCCGTCAA CGGGCGTGAC 
CTGTTCAGCC GCATCGTCCA CGGCGCCCGC ACCTCCCTGC TGGTCGCCAC GGTCGCCACC 
CTGGTCTGCG TGGTCATCGG CACCGTCCTG GGCATGGTCG CCGGGTACTT CGGCGGCTGG 
GTCGACACCG TCATCAGCCG GGCCATGGAC ATCTTCCTGG CCTTCCCGCT GCTGCTCTTC 
GCCATCGCCC TGGTCGGCGT CATCCCCGAC GGCTCCTTCG GCCTGAGCGG CAACGGCCTG 
CGCATCGGCG TGCTGGTCTT CATCATCGGG TTCTTCAACT GGCCCTACAT CGGCCGCATC 
GTGCGCGGAC AGACCCTGAC CCTCCGGGAG CGCGAGTTCG TGGAGGCCTC CCGCAGCCTC 
GGCGCGGGCA GCGCCCACAT CGTCTTCCGC GAGATCCTGC CCAACCTCGT CACGCCGATC 
CTGGTCTACT CCACGCTGCT CATCCCCACC AACATCCTGT TCGAGGCGGC CCTGAGCTTC 
CTGGGCGTGG GCATCAACCC GCCCATGGCC ACCTGGGGCG GCATGCTCGA CAACGCCCTG 
CGCTTCTACA CCGTCGCACC GCACTTCGTG CTCATCCCGG GGCTGGCCAT CTTCGTCACC 
GTCCTGGCCT TCAACCTCTT CGGCGACGGG CTGCGCGACG CCTTCGACCC CCGCTCCTCC 
GACTGA

Protein sequence

MSVPMDAPES SQHADPEAAA AGGRGSANRS LRQIAWRRFR RDRLGMAGGV VVILLILVAV 
FAPLLTSWFG YPPNQFNQEL IDPLTGGVLR DPADPSLGLD PWGGISADHL LGVEPVNGRD 
LFSRIVHGAR TSLLVATVAT LVCVVIGTVL GMVAGYFGGW VDTVISRAMD IFLAFPLLLF 
AIALVGVIPD GSFGLSGNGL RIGVLVFIIG FFNWPYIGRI VRGQTLTLRE REFVEASRSL 
GAGSAHIVFR EILPNLVTPI LVYSTLLIPT NILFEAALSF LGVGINPPMA TWGGMLDNAL 
RFYTVAPHFV LIPGLAIFVT VLAFNLFGDG LRDAFDPRSS D