Gene Ndas_5257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5257
Symbol
ID	9249155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	420439
End bp	421515
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	75%
IMG OID
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_003683143
Protein GI	297564170
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGCCC AGACCCGCGA CGACGTGGTC CTGGACATCC GGGGCCTTCG GACCCACTTC 
ACCACCGACG ACGCCGTGGT GCGCGCCGTG GACGGGGTGG ACCTGGCGGT CCGCCGGGGC 
AGCACGCTGT GCGTGGTCGG CGAGAGCGGC TGCGGCAAGA GCGCCATGGC CCGCTCGGTG 
CTGCGGCTGG TGGAGCCGCC CGGCGAGGTG GTGGGCGGCC GGATCCTGCT GCACCCGGAA 
CAGGGGGGCG GGCAGCCCGT GGACCTGGCC GCCCTGCACC CCACCGGCAG GGAGATCCGC 
GCGGTGCGCG GCCGCGAGGT GGCCATGGTC TTCCAGGAGC CCATGTCCTC GCTGTCCCTG 
GTGCACACCG TCGGCAACCA GATCGGCGAG TCCCTGCGCG TGCACCACCG CGTGTCCCGC 
CGTGAGGCCC GCGAACGCTC CGTGGACCTG CTCGAACGCG TGCGGGTCCC CGGCGCCGGA 
CGCGTCGTGG ACTCCTACCC CTTCCAGCTC TCCGGCGGGA TGCGCCAGCG GGTCATGATC 
GCGGCGGCCC TGGCGTGCGG GCCGCGCGTG CTCATCGCCG ACGAGCCCAC CACCGCGCTG 
GACGTGACCA CCCAGGCACA GATCCTCGAC CTGTTCGCCG ACCTGCGCCG CGACACCGGC 
ATGGGCCTGC TCTTCATCAC CCACGACATG GGCGTGGTCG CGGAGATGGC CGACGAGGTC 
GCCGTCATGT ACCTGGGCAC GGTGGTCGAG CAGGGGCCGG TGGACGAGAT CTTCCACGAC 
CCCCGCCACC CCTACACCCG CGCCCTGCTG GAGGCGGTCC CCCGGATCGG CGCGGCCCGC 
TCACGCCGCC TGCCCACCAT CCGGGGCGCC ATCCCCGACC CCGGGAGCCA GCCCACCGGC 
TGCGTGTTCC GCACCCGCTG CCCCCAGGCC GTGGAGGGGC TGTGCGACAC CACCGTCCCC 
CCGGTCACCG CCCCCGGCCC CGGCCGCCGG GTGCGCTGCC TCCTGGAGGG CGGCGTCCCG 
GCCCCAGGCG GCGCGGGCGC CGAACCGACC AGCGAGGAGA CCGTCGATGC CGACTGA

Protein sequence

MAAQTRDDVV LDIRGLRTHF TTDDAVVRAV DGVDLAVRRG STLCVVGESG CGKSAMARSV 
LRLVEPPGEV VGGRILLHPE QGGGQPVDLA ALHPTGREIR AVRGREVAMV FQEPMSSLSL 
VHTVGNQIGE SLRVHHRVSR REARERSVDL LERVRVPGAG RVVDSYPFQL SGGMRQRVMI 
AAALACGPRV LIADEPTTAL DVTTQAQILD LFADLRRDTG MGLLFITHDM GVVAEMADEV 
AVMYLGTVVE QGPVDEIFHD PRHPYTRALL EAVPRIGAAR SRRLPTIRGA IPDPGSQPTG 
CVFRTRCPQA VEGLCDTTVP PVTAPGPGRR VRCLLEGGVP APGGAGAEPT SEETVDAD