Gene Ndas_0397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0397
Symbol
ID	9244235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	488252
End bp	489361
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	74%
IMG OID
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_003678351
Protein GI	297559377
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.742277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCGT TCGAGGGCGC CGCCAAGCTC TATCCCGACG GCACGGTGGC CGTCGACCAG 
CTGGACCTGA CCGTCGAGAC CGGCCAGACG ACGGTCTTCG TGGGTCCCTC CGGCAGCGGC 
AAGACCACGT CGCTGCGGAT GATCAACCGC ATGGTCGAAC CGACCGGGGG CACCGTCCGC 
ATCGACGGCG AGGACGTGCG CGAGCGCGAC CCCGCCGCGC TGCGCCGCTC CATCGGCTAC 
GTCATCCAGC AGGCCGGGCT CTTCCCGCAC CGCACCGTGC GCGACAACAT CGCCACCGTG 
CCCCTGCTGC TCGGCTGGGG CCGGGCCAGG GCCAGGGCGC GCGCCGCGGA GCTGATGGAA 
CTGGTAGGTC TGGAGCCCGC CCAGGCCAGG CGCTACCCCC ACCAGCTCTC CGGGGGGCAG 
CAGCAGCGCG TCGGCGTCGC CCGCGCGCTG GCCGCCGACC CGCCCATCCT GCTGATGGAC 
GAACCCTTCA GCGCCGTGGA CCCCGTCGTG CGCGCCAGCC TCCAGGACGA GCTCCTGCGC 
CTGCAGAAGG AGCTGCACAA GACCATCGTC TTCGTCACCC ACGACATCGA CGAGGCCGTC 
CGGCTCGGTG ATCGCATCGC CGTCTTCCGC CCCGGCGGGA GGCTCGCCCA GTACGACACG 
CCCCAGAACC TGCTGGCCGC GCCCCAGGAC GCCTTCGTGG AGTCCTTCAT CGGCTACGAC 
CGGGGAGTGC GGCGCCTGTC CTTCTTCCCG GCCGACAGGC TCTCCCCGCG CCAGGACGCC 
GTCCTGGAGG AGAGCGTGCG CGCGGGCGCC GCGGTCGCCC CGCTCGGGAA CGAGCCCTGG 
GCCCTGGTCG TCAGCGGCGA CCGCATGCCC CTGGGCTGGG TCAGCGCGCG GCAACTGGCC 
GACGCGCCCG CCGACACCGC CCTGGGCTCA CTCGAACTCG CGCCCTTCGG CCACACCTTC 
GACGTGGGCA CCGACTCCCT GCGCGCCGCC CTGGACGCGG CGGTGCTCTC GCCCGCGGGC 
CGCGCGGTCG GCGTCGACGC CGACGGTCGG GTGGTCGGCG TGGTCTCGCA GGACGACCTG 
GGCGCCGCTC TGTGGTCGGT GACCGAGTGA

Protein sequence

MIAFEGAAKL YPDGTVAVDQ LDLTVETGQT TVFVGPSGSG KTTSLRMINR MVEPTGGTVR 
IDGEDVRERD PAALRRSIGY VIQQAGLFPH RTVRDNIATV PLLLGWGRAR ARARAAELME 
LVGLEPAQAR RYPHQLSGGQ QQRVGVARAL AADPPILLMD EPFSAVDPVV RASLQDELLR 
LQKELHKTIV FVTHDIDEAV RLGDRIAVFR PGGRLAQYDT PQNLLAAPQD AFVESFIGYD 
RGVRRLSFFP ADRLSPRQDA VLEESVRAGA AVAPLGNEPW ALVVSGDRMP LGWVSARQLA 
DAPADTALGS LELAPFGHTF DVGTDSLRAA LDAAVLSPAG RAVGVDADGR VVGVVSQDDL 
GAALWSVTE