Gene Ndas_2205 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2205
Symbol
ID	9246055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2635324
End bp	2636415
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	75%
IMG OID
Product	transport system permease protein
Protein accession	YP_003680133
Protein GI	297561159
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.264091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000202612
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGCCGCA CCCTGACACC CCGCCGCCCG CGCGAGCGCG CCCGCACCAC ACCCCGCGGC 
TCCTTCGCCC TGCGCCTGTT CGGCGAACGC CTGTCCCTGC TGGTGCGCCC GCGCACCCTC 
GTCGTCGCCG CCGTCCTGAC CGCGCTCAGC GCCGCCGCCC TGATCGTCTC GGTGGCCGTG 
GGCGACTACG AGATCCCGCT CGGCGCCGTG CCCGCCGCGA TCGCGGGCTA CGGCGAACGC 
CTGGACGTGT TCTTCGTCCA AGGGGTGCGC CTGCCCCGCG CCCTGACCGC CATCGGCGTG 
GGCGCCGCCT TAGGGCTCGC CGGAGCCGTC TTCCAGAGCC TGTCGCGCAA CGCCCTGGGC 
AGCCCCGACA TCATCGGCTT CACCGGCGGC GCCGCCACCG GAGCCGTCGC CGTCATCCTG 
CTCTTCGGCG CCGGACGCCT GGGCGTGTCC CTGGGCGCCA TCGCCGGGGG CATGCTCACC 
GCCGCCGCCG TGTACCTGCT CTCCACCAAG AACGGCGTCC AGGGCTACAG GCTGGTCCTG 
GTCGGCATCG GCATGGCCGC CATGCTCGGC GCCGTCCGCG ACTACCTGCT CACCCGAGCC 
GAACTCACCG ACGCCCTCGG CGCCCAGATC TGGATGATCG GCAGCCTCAA CGGCCGCGGC 
TGGGCCGAGG TCGCGGCCGT GTGGATCTGC CTGGTCCTGC TGGGACCGGT CCTGCTCGCC 
CTGGGCCAGC GCCTGCGCTT CATGGAACTG GGGGAGGACA CCGCGCGCGG CCTGGGCGTG 
CCCACCCGCT CCACCCAGCT GACCGCCCTG GCCGCCGCCA GCGCCCTGAC CGGCGCCGCC 
ATCGCCGTCT CGGGCCCCAT CGGCTTCGTC GCCCTGGCCG CACCCCAGCT GGCCCGCCGC 
CTGATGCGCA CCGGCGGCAC CACCCTGGCC GGATCCGCGC TCATGGGCGC CGCCCTGCTG 
GCGGTGGCCG ACCTGGTCGC GCTGCGCGCC CTGGCCCCCA CCCAGCTGCC CGTGGGCGTG 
GTCACCGCCG TCATCGGCGG CAGCTACCTG ATCTGGTTGC TCTACACCGA ATGGCGCGGC 
GGACGTGCCT GA

Protein sequence

MSRTLTPRRP RERARTTPRG SFALRLFGER LSLLVRPRTL VVAAVLTALS AAALIVSVAV 
GDYEIPLGAV PAAIAGYGER LDVFFVQGVR LPRALTAIGV GAALGLAGAV FQSLSRNALG 
SPDIIGFTGG AATGAVAVIL LFGAGRLGVS LGAIAGGMLT AAAVYLLSTK NGVQGYRLVL 
VGIGMAAMLG AVRDYLLTRA ELTDALGAQI WMIGSLNGRG WAEVAAVWIC LVLLGPVLLA 
LGQRLRFMEL GEDTARGLGV PTRSTQLTAL AAASALTGAA IAVSGPIGFV ALAAPQLARR 
LMRTGGTTLA GSALMGAALL AVADLVALRA LAPTQLPVGV VTAVIGGSYL IWLLYTEWRG 
GRA