Gene Ndas_2438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2438
Symbol
ID	9246288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2891721
End bp	2892812
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	76%
IMG OID
Product	transport system permease protein
Protein accession	YP_003680364
Protein GI	297561390
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0761977
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.566289
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCCCCC ATGTGGCCGG GAGGCCCGTG ACGGCCGTGC CCTCGGGAGT CCGGCGCCGG 
CTGCGGGCCG CGGCCGACGG TTCCGGGGTT CTCGTCAGTG CCCGCGCCCG CGTCGCCGGG 
TTGGCGGTGG CGCTGCTGGT CCTGGCCGCG ACCCTGCTGG CGTCGGTCCT GGTCGGTTAC 
GAGCGGCTGT CCGTGGCCGA CGTGTACCTC GCCTACGCCG GTTTCACCGG TTCGGACACC 
GACTTGGTCG TGCGGCACCT GCGTGTGCCG CGTACCCTGG CCGGGCTGGC GGTCGGCGCG 
GCCCTGGGCG TGTCCGGGGT CCTGGCGCAG GGGGTGACCC GCAACCCCCT CGGTGACCCC 
GGCGTCCTCG GCATCAACGC GGGCGCCTCC CTGGCGGCGG TCCTCGCGAT CAGCGTGTTC 
GGGGTGTCCG CGCTACTGGG CTACGTCGGC TTCGCCTTCG CGGGCGCGGC GGTCGCCGCC 
TGCGTGGTCC ACGCCGTGGG GTCGCTGGGT CCGGAGGGGG CCAGTCCGGT CAGGCTCACG 
CTCGCCGGAG CCGCGGTCTC GGCCCTGCTG GCTTCGCTGA CCTCGGCGAT CGTCCTGCGC 
GACCGCGCGA GCCTGGACGA GTACCGGTTC TGGGTGGTGG GCTCGCTGGC GGGTGCCGAC 
GGCGCGGCGC TGCTCCAGGC GCTGCCGTTC CTGGCCGCCG GGCTGGTGAC GGCGGTGGCG 
GTGGCCCGGT CCCTGAACGC GGTGGCGCTC GGCGACGAGC TGGCCCGCTC CCTGGGGACA 
CGGCTGTGGC TGGTGCGCGG GACGAGCGCC CTGGCGGTGG TGCTCCTGGC GGGGACGGCG 
ACGGCCGTGG CGGGTCCGAT CGGCTTCGTC GGGGTCGCCG TGCCGCACGT GGCGCGGGTC 
CTGGTCGGCC CCGACCACCG ATGGGTGCTG CCCTGGTCGG CGGTGCTGGC GCCCGTCCTG 
TTGTTGGCGG CCGACGTCGC GGGCCGGGTG GTGGCGCGTC CCGAGGAGTT GCAGGTCGGC 
GTCCTCACCG CTCTCATCGG TGCGCCGTTC TTCGTCCTCG TGGTGCGCGG GCGAAGGGTG 
GCGGGGCCGT GA

Protein sequence

MAPHVAGRPV TAVPSGVRRR LRAAADGSGV LVSARARVAG LAVALLVLAA TLLASVLVGY 
ERLSVADVYL AYAGFTGSDT DLVVRHLRVP RTLAGLAVGA ALGVSGVLAQ GVTRNPLGDP 
GVLGINAGAS LAAVLAISVF GVSALLGYVG FAFAGAAVAA CVVHAVGSLG PEGASPVRLT 
LAGAAVSALL ASLTSAIVLR DRASLDEYRF WVVGSLAGAD GAALLQALPF LAAGLVTAVA 
VARSLNAVAL GDELARSLGT RLWLVRGTSA LAVVLLAGTA TAVAGPIGFV GVAVPHVARV 
LVGPDHRWVL PWSAVLAPVL LLAADVAGRV VARPEELQVG VLTALIGAPF FVLVVRGRRV 
AGP