Gene Ndas_1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1238
Symbol
ID	9245088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1539088
End bp	1540236
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	76%
IMG OID
Product	membrane protein
Protein accession	YP_003679183
Protein GI	297560209
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.375166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0948074
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCCCG AACCCGAGAA CCGTCCGGCC GCGACCGACC GGCGCTCCGT GCCCTCGCCG 
CGCCGCGCCC GCCAGGAGGA CTCCGGTCCC CGGCACGCCT GGGAGCGGCC GACCGGGGGC 
GGGCGCGCCC GCGGGCAGCG GCTGCCCGCG CTGGCCGCGC TCGTCCTGAT CGGGGTGCTG 
TGCGCGGTGG GCCTGGGCTA CCTGGCGGTG CGGTTCACCG GGCTGGTGCG CGTCTTCTTC 
TCCGAGGCGG CGCTGGCGGT GTTCCTGGGG CTGGTGACGC TGGCCTTCGG GTTCTGGGTA 
CTGCGCCGCA TCCGTCCGGT GCGCGACCCC GCCCTGGACG CCTCCGTGGT CGCGGTGCTC 
TGGGGTCTGA CCGCCGCGCC GGCGGGCGGG GTCGTCGCCA ACGCGGGCCT GGGCTCGATC 
TGGGCCAAAA GCCTGGGGCT GCCCTTCTCC GGGGTCTGGG GGGCGGCCAT GACCGCCCCC 
CTCAACGAGG AGGTGCTCAA GCTCGCCGGG ATCGTGCTGG TGGCGGTGGC CTTCCCCGCC 
GCCGTGCGCG GTCCGGTGGA CGGGTTCGTG ATCGGGTCCC TGGTGGGTCT GGGCTTCGAG 
GTGACGGAGA ACTTCGTCTA CTCGATGAAC GCGATCGTCC AGTCGGGCGG CACCGGCGGA 
CTGGTGCCGG TGGCGCAGAC GACCGTGGTG CGGCTGGTCC TGACGGGGTT GGGCTCGCAC 
TGGGCGATGT CGGCGGTCGC GGGCACCGCC GTGGGCCTGC TGGCGGCGGT GGCGTGGCGG 
CCCGGCAGTC ACAGGGCCGG GGCCGCCGCC CTGCTGGTGC TCCTGGCGAT GGCGCTGCAC 
TGGCTGCTGG ACTCGCCGCT GTTCGCCGGG GTCGGTGGTG TCGTGTTCAA GGTCGCGGCG 
GTCTTCCTGA CCACGATGGC CGTGTACTTC ACCGTCCGGC ACGCCTACCG GCGCCGGGTG 
CGCGCGACGC TGGCCTCCGA GGGCGGGGCT CTGGGCATGC GGCGGTCGGC GGCGGTGGCC 
CTGGCCAACC GGCGCGGCCG CGTCGGGGAG CTGAGCCGCG TGGCGGAACC GGAGCGGCCC 
GCCGTGGAGA GGCGTCAGGA GCAGATGCTG GCGATCGCCG AGGACCGGGC GGTGCGCCGG 
ACGCCGTGA

Protein sequence

MNPEPENRPA ATDRRSVPSP RRARQEDSGP RHAWERPTGG GRARGQRLPA LAALVLIGVL 
CAVGLGYLAV RFTGLVRVFF SEAALAVFLG LVTLAFGFWV LRRIRPVRDP ALDASVVAVL 
WGLTAAPAGG VVANAGLGSI WAKSLGLPFS GVWGAAMTAP LNEEVLKLAG IVLVAVAFPA 
AVRGPVDGFV IGSLVGLGFE VTENFVYSMN AIVQSGGTGG LVPVAQTTVV RLVLTGLGSH 
WAMSAVAGTA VGLLAAVAWR PGSHRAGAAA LLVLLAMALH WLLDSPLFAG VGGVVFKVAA 
VFLTTMAVYF TVRHAYRRRV RATLASEGGA LGMRRSAAVA LANRRGRVGE LSRVAEPERP 
AVERRQEQML AIAEDRAVRR TP