Gene Ndas_0244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0244
Symbol
ID	9244078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	299364
End bp	300791
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	71%
IMG OID
Product	amino acid permease-associated region
Protein accession	YP_003678199
Protein GI	297559225
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.912876
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGACA ACAGCCAGAG TTTCGTCCGG GTGCTGGGAA GGGGTGACGT CCTCGCCCTC 
GGCTTCGGCG CGATGATCGG CTTCGGCTGG ATCGTGCTGG TGGGCGACTT CGTGAGCGCG 
GCGGGCAGCG CGGGCGCGGC GCTGGCCTTC GTGATCGGCG GCGTCATCAT GGCCTTCGTC 
GGCCTCGCCT ACGCCGAGCT CGTCGCCGCG ATGCCGCACG CGGGCGGGGA GCACCACTAC 
GCCATGCGCG CCATCGGCCC CAAGGGGGCC TTCACCGCCT CCTGGGCCAT GATCCTGGGC 
TACGTCTCCG TCGTCGCCTT CGAGGCCGTG GCCGTCCCCC AGACCCTCGT CTACCTCTTC 
CCCGACATGG CGGTCGGCCG CCTGTGGACC GTCGCCGGGT ACGACGTCCA CGCCGGTCTG 
GTCGCCGTCG GCGTGGCCGC GGCCGTGCTG ATGACCGCCG TCAACTACGT CGGCATCAAG 
CCCGCGAGCG TCTTCCAGAC CATCGCGGTG CTGTTCCTGC TGCTCACCGG GGCCGCCATG 
GTCACCGGCG CGTTCGTCGG CGGTTCCGTG GACAACATGC GGCCGCTGTT CACCGGCGGC 
GCCCCGGGCA TGTTCGTGGT CCTGGTCGCG GTCCCGTTCC TCTTCGTCGG CTTCGACGTC 
ATCCCGCAGT CGGCCTCCGA GATCAGACTC CCGTACCGCG TGGTCGGCAC CCTGCTGGTG 
CTGTCGGTGT TCTGCGCGAC CGCCTGGTAC GTGATGGTCA TGCTGACGGC GGGCTCGGGT 
CTGGGCCCGG CCGAACTGGC GGACTCGGAA CTGGCCTCCG CCGACGCCGT CGCCGCCATG 
TGGGACAGCG CGACCATGGG CAACCTGCTC GTCCTCGGCG GCGTCGCGGG CCTGCTCACC 
AGCTGGAACG CCTTCCTCAT CGGCGGCAGC CGCCTCATCT ACGCCATGGC CGCCTCGCGG 
ATGCTCCCGG CCTGGTTCGG CCGCCTGCAC CCGCGCTTTC GCACCCCGTC CAACGCCGTG 
CTGTTCGTCG GAGCGCTCTC CCTGGTGTCC CCGTTCTTCG GCGAGCCGAT GCTGGGCTGG 
CTGGTCAACG CGGGCGGCCT GAACATCGTG GTCGGTTTCG TCACGGTGGT GGTCAGCTTC 
CTCGTACTGC GACGCCGCGA ACCCGCCATG GAGCGGCCCT TCACCGTTCC GGCGGGCGTC 
CCCGTCGGCG TGGTGGCCCT CGTGCTGTCC GTGGGGCTGC TCCTGCTCTA CCTGCCCGGC 
ATGCCCGCGG CGCTGAGCTG GCCCAACGAG TGGCTGATGG TGCTCGTGTG GTGGGTGGCC 
GGGGCCGCCC TGATGTGGCG TCTGCCCCGG ATCACCGCGG GCCCCGACGC CGAGCGGCGC 
CTGGTCGAGG TGATGGACGC GCGCTCGCGC CCGGACCCGC GGGCCTGA

Protein sequence

MSDNSQSFVR VLGRGDVLAL GFGAMIGFGW IVLVGDFVSA AGSAGAALAF VIGGVIMAFV 
GLAYAELVAA MPHAGGEHHY AMRAIGPKGA FTASWAMILG YVSVVAFEAV AVPQTLVYLF 
PDMAVGRLWT VAGYDVHAGL VAVGVAAAVL MTAVNYVGIK PASVFQTIAV LFLLLTGAAM 
VTGAFVGGSV DNMRPLFTGG APGMFVVLVA VPFLFVGFDV IPQSASEIRL PYRVVGTLLV 
LSVFCATAWY VMVMLTAGSG LGPAELADSE LASADAVAAM WDSATMGNLL VLGGVAGLLT 
SWNAFLIGGS RLIYAMAASR MLPAWFGRLH PRFRTPSNAV LFVGALSLVS PFFGEPMLGW 
LVNAGGLNIV VGFVTVVVSF LVLRRREPAM ERPFTVPAGV PVGVVALVLS VGLLLLYLPG 
MPAALSWPNE WLMVLVWWVA GAALMWRLPR ITAGPDAERR LVEVMDARSR PDPRA