Gene Ndas_0077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0077
Symbol
ID	9243908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	99189
End bp	100814
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	71%
IMG OID
Product	delta-1-pyrroline-5-carboxylate dehydrogenase
Protein accession	YP_003678035
Protein GI	297559061
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.889005
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.597018
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCCG TGACCAACGT CCCTCTGCCC CAGAACGAGC CCGTTCTGTC CTACGCGCCC 
GGCAGCGCCG AGCGCGAGGA ACTCGTGGCC AAGCTGGAGG AGCTCGGCAG CCGGAGCATC 
GACCTGCCGA TGCGCATCGG CGGCGAGAGC CGCATGGGCG GCGGCGAGCC CATCGACGTC 
GTGCAGCCGC ACCGCCACGC CGCGGTCCTG GGCACCATGC GCAACGCCAC CCACGAGGAC 
GCCCGCGACG CCGTCGCCGC AGCCAAGGCC GCCGCCCCCG CCTGGCGCGC GATGTCCTTC 
GACGACCGCG CCGCCATCCT CCTGCGCGCC GCCGAACTGC TCTCGGGCCC CTGGCGCGCC 
ACCATCAACG CCGCCACCAT GCTCGGCCAG TCCAAGACCG TGCAGCAGGC GGAGATCGAC 
TCGGCCTGCG AGCTGATCGA CTTCTGGCGC TTCAACGTCT CCTACGCCCG CGACCTGATC 
GCCCAGCAGC CGCTGAGCGT CAAGGGCGTG TGGAACCGCA TGGAGCAGCG CCCCCTGGAG 
GGGTTCGTCT ACGCGATCAC CCCCTTCAAC TTCACCGCCA TCGCGGGCAA CCTGCCCACC 
GCCCCGGCCC TGATGGGCAA CGTGGTCGTG TGGAAGCCGT CCCCGACCCA GCAGTTCGCC 
GCCGAGCTGA CCATGCGCCT GCTGGAGGAG GCGGGCATGC CCCCCGGCGT CATCAACATG 
GTCACCGGTG ACGGCCTCGC CGTCTCCGAC GTCGCCCTCA ACGACCCGGA GCTGGCCGGT 
GTGCACTTCA CCGGTTCGAC CAGGACCTTC CAGCACCTGT GGAAGAGCGT GGGCGAGAAC 
ATCGCCAACT ACCGCTCCTA CCCGCGCATC GTCGGCGAGA CCGGCGGCAA GGACTTCATC 
GTCGCCCACT CCTCGGCCGA CCCCGAGGTC CTGCGCACCG CCATCGTGCG CGGCGCCTTC 
GAGTACCAGG GCCAGAAGTG CTCGGCCGCC TCGCGCGCCT TCGTCGCCCG CTCGGTGTGG 
GAGCAGGTCC GCGACGACCT CGTCGCCGAG ACCGAGGCCC TGACCATGGG CGACGTCACC 
GACCTGTCCA ACTTCGTCGG CGCCGTCATC GACCGCCGCG CCTTCGACAA GCTGGCCAAG 
GTCCTGGAGG ACGCCAAGTC CGACCCGACC CTGACCGTCC TGGCGGGCGG CACCGCCGAC 
GACTCCGTCG GCTACTTCGT GCGCCCCACC ATCATCGAGG GCACCGACCC GTCCCACGAC 
GTGTTCCGCA CCGAGTACTT CGGCCCGGTC GTCGCCGTCC ACGTCTACGA GGACGAGAAG 
TTCGACGAGG TCCTCAAGAC CGTCGACGAG GGCTCGGCCT ACGCCCTGAC CGGCGCCGTC 
CTGGCCAGGG ACCGCGCCGC CGTGGCCAAG GCCAGCGAGG CCCTGCGCTT CGCCGCGGGC 
AACTTCTACG TCAACGACCG CCCGACCGGC TCCATCGTGG GCCAGCAGCC CTTCGGCGGC 
GGGCGCGCCT CCGGCACCAA CGACAAGGCG GGTTCGGCGC AGAACCTGTC CCGCTGGTCC 
AGCCCGCGCG CCATCAAGGA GACCTTCGTC GCGCCGACGG TCTCCTCCTA CCCCCACCAG 
GGCTGA

Protein sequence

MDAVTNVPLP QNEPVLSYAP GSAEREELVA KLEELGSRSI DLPMRIGGES RMGGGEPIDV 
VQPHRHAAVL GTMRNATHED ARDAVAAAKA AAPAWRAMSF DDRAAILLRA AELLSGPWRA 
TINAATMLGQ SKTVQQAEID SACELIDFWR FNVSYARDLI AQQPLSVKGV WNRMEQRPLE 
GFVYAITPFN FTAIAGNLPT APALMGNVVV WKPSPTQQFA AELTMRLLEE AGMPPGVINM 
VTGDGLAVSD VALNDPELAG VHFTGSTRTF QHLWKSVGEN IANYRSYPRI VGETGGKDFI 
VAHSSADPEV LRTAIVRGAF EYQGQKCSAA SRAFVARSVW EQVRDDLVAE TEALTMGDVT 
DLSNFVGAVI DRRAFDKLAK VLEDAKSDPT LTVLAGGTAD DSVGYFVRPT IIEGTDPSHD 
VFRTEYFGPV VAVHVYEDEK FDEVLKTVDE GSAYALTGAV LARDRAAVAK ASEALRFAAG 
NFYVNDRPTG SIVGQQPFGG GRASGTNDKA GSAQNLSRWS SPRAIKETFV APTVSSYPHQ 
G