Gene Ndas_3633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3633
Symbol
ID	9247502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4358047
End bp	4359153
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	71%
IMG OID
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_003681539
Protein GI	297562565
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.19475
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC TGCGGATCAA CGACCTCAAG GTGCACTTCC CCATCAGGAA GGGGGTGTTC 
TTCGACCGCA CCATCGGCCA CGTGCGCGCG GTCGACGGCG TCAGCCTGGA GATCGAGAGC 
GGCCAGACCT ACGGCCTGGT GGGCGAGTCC GGCTGCGGCA AGACCACCCT GGGCCGCGCG 
GTGCTGCGCC TGGTGGACGT CACCGAGGGC GAGGTGCTCT TCGGCGGGCA GGACCTGGCC 
GGTCTGGACG AGGAGTCGAT GCGCCGCCAG CGCAAGAACC TCCAGATGGT CTTCCAGGAC 
CCGCTGGGCA GCCTCAACCC CCGGCAGAAC ATCGGTTCCA TCCTGCTGGA GGGCTTGCAG 
ACCCACGGGA TCGGCGGCCC CGCGCCGGGG GAGGGGCCCT CCGGCGGCAG GGAGCGCCGC 
GCCCTGGTCC TGGAGGACCA GCGCAGGCGC GTGGTCGACG CCCTGGAGAG GGTGGGCCTG 
TCGGCCAAGG CGCTCACCCG CTACCCGCAC GAGTTCTCCG GCGGCCAGCG CCAGCGCATC 
GGCATCGCCC GCGCGCTGGT GCTGGAGCCC GACCTCATCA TCTGCGACGA GCCGGTGTCG 
GCGCTGGACG TGTCGATCCA GGCCCAGGTG CTCAACCTGT TGGAGAGCCT CCAGGAGGAA 
CTGGGGCTGA CCTACCTGGT CATCGCGCAC GACCTGGCCG TGGTCCGCCA CGTCAGTGAC 
GTGGTCGGGG TGATGTACCT GGGCGGCCTG GTGGAGGAGG CCTCCAGCGA CGACCTGTAC 
GAGACGCCGA TGCACCCGTA CACGCGCTCC CTCATGTCGG CGGTGCCGGT CCCCGACCCG 
GAGGTGGAGG ACAGCCGCGA GCGCATCCTG CTGGCGGGAG ACCTGCCCTC GCCCGCCGAC 
CCGCCCAAGG GCTGCCGCTT CCACACCCGC TGCCCGTGGC GGCAGAAGGA GCGGTGCGAC 
ACCGAGCGGC CCGAACTGCG CCCGGTCGGG AACGCCGCCG GGGGCGGCAC CCACAGGGTG 
GCCTGCCACT ACGCCGAGCA GATCCTCTCG GGCGAGATCC AGCCCAGGGA GGAGATGGCC 
GAGCGCATCG TGCACGGCAC CGGTTGA

Protein sequence

MSLLRINDLK VHFPIRKGVF FDRTIGHVRA VDGVSLEIES GQTYGLVGES GCGKTTLGRA 
VLRLVDVTEG EVLFGGQDLA GLDEESMRRQ RKNLQMVFQD PLGSLNPRQN IGSILLEGLQ 
THGIGGPAPG EGPSGGRERR ALVLEDQRRR VVDALERVGL SAKALTRYPH EFSGGQRQRI 
GIARALVLEP DLIICDEPVS ALDVSIQAQV LNLLESLQEE LGLTYLVIAH DLAVVRHVSD 
VVGVMYLGGL VEEASSDDLY ETPMHPYTRS LMSAVPVPDP EVEDSRERIL LAGDLPSPAD 
PPKGCRFHTR CPWRQKERCD TERPELRPVG NAAGGGTHRV ACHYAEQILS GEIQPREEMA 
ERIVHGTG