Gene Ndas_2439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2439
Symbol
ID	9246289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2892809
End bp	2893870
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	77%
IMG OID
Product	transport system permease protein
Protein accession	YP_003680365
Protein GI	297561391
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.107589
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCGC GCTCCGGGGC CCTGGGTCCC CGAACGGGGG TGGCCCGCCT GGGCGGACTG 
TCGGTACGGG TGTACTGGCC CGCGGTACTG CTCGGCGGCC TGCTCACCGC CCTGGCCGCG 
GCGGTGGCCC TGGTCTCGCT GACCCTGGGG GACTTCGAGC TGGGCGTGAG CGAGGTGGTG 
GACGCGCTCA CCGGCCGTGC CGGGGTGATG GTGACGCACG TGGTGGTGGA GATGCGGCTG 
CCGCGTGTGC TCACCGCGCT GGGTGTGGGC GCCGCACTGG CGCTCTCGGG GGCGCTGCTG 
CAACGGCTGG CGCACAACCC GCTGGTCAGC CCGGACGTCA TCGGGGTCAG CGCGGGCGCG 
ACGACCGCGG CGGTGCTCGC CATCGTCGTC TTCGGCGGCA CGGCGGCGGC GATCGCGGCC 
AGCGCGCTGG CGGGGGCCGT GGCCACCGCG TTCCTGCTGT ACCTGCTCGC CTACCGGCGC 
GGTGTCAGCG GGCAGCGGCT GGTCCTGGTG GGGATCGCGG TCACCGCGGT GCTGGGCGCG 
GTGACGTCGT ACCTGCTCAC CCGCACGGAG CTCGCCACGG CGCAGCGCGC CATGCTCTGG 
CTCACCGGCA GCCTGGCCAA CCGGGACTGG CCGCACGTGG TGACGGTGGC GGTGGGGTTG 
GCCGTCCTGG CTCCGACCAC GTTCCTGTCG GCCCGACCGC TGTCCCTGCT CCAGCTCGGG 
GAGGACGCGG CGACCGCCCT GGGCGGCCGG GTGCGGCTCG CCCGGGGCGC CCTGCTGTTC 
ACCTCCGCCG CGCTCGCGGC CACGGCCACC GCCGTCGCCG GTCCCGTCGC GTTCGTCGCC 
CTGGTGGCCC CGCAGATCGT GCGGCGGCTG CTGGGCGGAC GCGCCCTCGG GCTGCTGCCC 
TGCGCCGCCT GCGGAGCGCT CCTGACGGCC GTTGCGGACC TGGTCGCGCG CACCGCCTTC 
GGGGGGAGCG AACTGCCGGT CGGGGTGGTC ACCGGGGCGC TGGGCGCCCC CTTCCTGCTG 
TACCTGCTGG CCCGCGGCGG CAGGGCGGGA CGGGACCGGT GA

Protein sequence

MTARSGALGP RTGVARLGGL SVRVYWPAVL LGGLLTALAA AVALVSLTLG DFELGVSEVV 
DALTGRAGVM VTHVVVEMRL PRVLTALGVG AALALSGALL QRLAHNPLVS PDVIGVSAGA 
TTAAVLAIVV FGGTAAAIAA SALAGAVATA FLLYLLAYRR GVSGQRLVLV GIAVTAVLGA 
VTSYLLTRTE LATAQRAMLW LTGSLANRDW PHVVTVAVGL AVLAPTTFLS ARPLSLLQLG 
EDAATALGGR VRLARGALLF TSAALAATAT AVAGPVAFVA LVAPQIVRRL LGGRALGLLP 
CAACGALLTA VADLVARTAF GGSELPVGVV TGALGAPFLL YLLARGGRAG RDR