Gene Ndas_4056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4056
Symbol
ID	9247928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4852021
End bp	4853130
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	74%
IMG OID
Product	inner-membrane translocator
Protein accession	YP_003681958
Protein GI	297562984
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0407655
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACCCC CACCGACCTC CGTCCTCCGG AGCCTGCGCG CCCGGACGGG CACCACCGGG 
CTGGTCTACC TGGCCCTGGT GCTGCTGCTC GCGGTCAGCG CGGCCTTCGT GGCCGCCCGG 
GGCGGCAACC TGTTCACCAC CGCCAACACC GTCGACCTGC TCACCCGCAG CAGCCTGCTG 
GGCTTCCTGG CCGTCGGGAT GACCCTCGTC ATCCTGTGCC GCTCCCTGGA CCTGTCGGTC 
GGCTACGTGG CCGCCCTGTC CACCGTGGTC GCGGCCACCA CCATGGCGGG CGACCCCTCC 
CGGATCGTCC TCGGCGTGGC CGCGGCGCTC GGCCTGGCCG CGCTGATCGG CCTGGTCAAC 
GGGCTGGTGG TCACGGGGCT GCGGGTCAAC CCCTTCATCG CCACCCTGGG CATGGGGCTG 
GTGATCAAGG GCTACCTGGA CACGAACTTC CAGGGCCCGG CCGGGGCGGT GCCCGCCGCC 
TTCCAGACCT TCGGCTACAC CCGGATCGGT GTGCTGCCCG TCTCCACCCT GGTCATGCTG 
GGCGTGGCGG TGGCGGCGGT GCTGTTCCTG AGCCGCACAC GGATGGGCTA CCACATCTAC 
GCCGTCGGCG GCGACGCCGA CGTGGCCCGG CTCTCCGGGG TCCGCTCCGG GGTGCCCACG 
GTCACCGCGC ACGTGTTGTG CTCGGTCACC GCCGGTGTGG CCGGTCTGCT GCTGGCCGCC 
CGGTTCGGGA CCGGCAGCGC CACCGTCTAC TCCGGGGGCT ACGAACTGGA GGCCATCGCG 
GCCGTGGTGC TGGGCGGGAC CTACCTGCTC GGCGGGCGCG GCGGCGTGGC CGGGACGGTG 
GCGGGGGTGC TCATCCTCGC CACGCTCGAC ACCGTGTTCA ACGTGCTGGC GGTCGACCCG 
TTCGTCAAGG ACGTCCTGCG CGGCGTCATC GTCATCGCCG CCGTGGCCGT CTACGCCCGC 
GGCGGGCGCT CCGCCGTGCG GACGCGCTTC CCCTCCGGCG GCGCGCCGCC GTCCTCCCCC 
GTGCCGCGGC CCGCCCCGGA CACCGGGACC GCCCCCGATC CGGACCCCGG GACGGGATCC 
GCACCGCAAC CCCTCGGAGG CCGCCGATGA

Protein sequence

MTPPPTSVLR SLRARTGTTG LVYLALVLLL AVSAAFVAAR GGNLFTTANT VDLLTRSSLL 
GFLAVGMTLV ILCRSLDLSV GYVAALSTVV AATTMAGDPS RIVLGVAAAL GLAALIGLVN 
GLVVTGLRVN PFIATLGMGL VIKGYLDTNF QGPAGAVPAA FQTFGYTRIG VLPVSTLVML 
GVAVAAVLFL SRTRMGYHIY AVGGDADVAR LSGVRSGVPT VTAHVLCSVT AGVAGLLLAA 
RFGTGSATVY SGGYELEAIA AVVLGGTYLL GGRGGVAGTV AGVLILATLD TVFNVLAVDP 
FVKDVLRGVI VIAAVAVYAR GGRSAVRTRF PSGGAPPSSP VPRPAPDTGT APDPDPGTGS 
APQPLGGRR