Gene Ndas_2381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2381
Symbol
ID	9246231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2829949
End bp	2831982
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	74%
IMG OID
Product	rhamnulose-1-phosphate aldolase/alcohol dehydrogenase
Protein accession	YP_003680308
Protein GI	297561334
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.932979
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGATG TCGTCGAACA GCTCCTCGCC CGCAGCAACA CCCTCGGCGC CGACCCGCGC 
AACACCAACT TCGCCGGGGG CAACACCTCC GCCGCGGACA CCCGCACCGA CCCCGTCACC 
GGACAGGACG TCGACCTGCT CTGGGTCAAG GGCTCCGGCG GCGACCTGGG CACCCTCACC 
GAGGACGGCC TGGCCGTGCT GCGCCTGGAC CGCCTGCGCG CCCTCGTGGA CGTCTACCCC 
GGCGAGGACC GCGAGGACGA GATGGTCGCC GCCTTCGACC ACTGCCTGTT CGGCAGGGGC 
GGCGCCGCGC CCTCCATCGA CACCGCCATG CACGGCCTGC TGCGCGCCGC GCACGTGGAC 
CACCTGCACC CCGACTCCGG CATCGCCCTG GCCACCGCCG CGGACGGCGA GCGCCTGACC 
CGCGAGTGCT TCGGCGACCG CGTGGTGTGG GTGCCCTGGC GCCGTCCCGG GTTCCAGCTC 
GGCCTGGACA TCGCCCGTAT CGCCGAGGAG AACCCCGACG CCATCGGCGC GATCCTGGGC 
GGCCACGGCA TCACCGCCTG GGCCGAGACC AGCGAGCAGT GCCAGGCCAA CTCCCTGGAG 
ATCATCCGCA CCGCCGAGGG GTTCTTGGAG GAGAACGGCC GCCCCGAGCC CTTCGGCCCC 
GTCCTGGAGG GCTACGGCGC CCTGCCCGAG GCCGAGCGCC GCCAGCGCGC CGCCGCCCTG 
GCCCCGGTCA TCCGCGGGCT GGCCTCCACC GACCACCCCC AGGTGGGCCG CTTCACCGAC 
AACGACGTGG TCCTGGACTT CCTGGCCGGG GCCGAGCACC CCCGCCTGGC CGCGCTGGGG 
ACCTCCTGCC CCGACCACTT CCTGCGCACC AAGGTCCGGC CCCTGGTGCT CGACCTGCCC 
GCCGACGCCC CGCTGGAGCG GGCCGTGGAG CGCCTGCGCG AACTGCACGG GGAGTACCGG 
GCCGAGTACC GCGCCTACTA CGAGCGCCAC GCCGACGCCG ACAGCCCCGC CATGCGCGGC 
GCCGACCCGG CGATCGTGCT GGTCCCCGGG GTGGGCATGT TCTCCTTCGG CAAGGACGCC 
AAGACCGCGC GCGTGGCGGG CGAGTTCTAC GTCAACGCGA TCAACGTGAT GCGCGGCGCC 
GAGTCCGTCT CCACCTACCG GCCCATCGAG GAGTCGGAGA AGTTCCGCAT CGAGTACTGG 
GCGCTGGAGG AGGCCAAGCT CGCCCGCCTG CCCGAGCCCA AGCCGCTCGC CGCCCGGGTC 
GCCCTGGTCA CGGGCGCGGC CAGCGGTATC GGCAAGGCCA TCGCCGCCCG CCTGGCGCGC 
GAGGGCGCCT GCGTGGTCGT GGCCGACCTG GACGCCGACA GGGCGGCCGC CGCCGCGGCC 
GAACTGGGCG GCTCCGACAC GGCCGTGGGC GTGGCCTGCG ACGTCAGCGA CGCGGACGCG 
GTGGCCCGCG CCTTCGCCGC GGCGGCCCTG GCCTTCGGCG GCGTGGACCT GGTGGTCAAC 
AACGCCGGGC TGTCCATCTC CAAGCCGCTG CTGGAGACCA GCGAGCGCGA CTGGGACCTT 
CAGCACGACG TCATGGCCAA GGGGTCCTTC CTGGTCTCGC GCGAGGCGGC CAGGACGATG 
ACCGCCCAGG GCATGGGCGG CGACATCGTC TACATCGCCT CCAAGAACGC CGTGTTCGCC 
GGTCCCAACA ACGTCGCCTA CTCCGCGGTC AAGGCCGACC AGGCCCACCA GGTGCGGCTG 
CTGGCCGCCG AACTGGGCGG CGAGGGAATC CGGGTCAACG GCGTCAACCC CGACGGGGTG 
GTGCGCGGCT CGGGCATCTT CGCCGGGGGC TGGGGCGCCC AGCGGGCCAA GGTGTACGGG 
GTCAGGGAGG AGGACCTGGG CGCGTTCTAC GCCCAGCGCA CCATCCTGGG CCGCGAGGTG 
CTGCCCGAGC ACGTGGCCAA CGCGGTGTTC GCGCTGACCG CGGGCGAGCT GTCGCACACC 
ACCGGCCTGC ACATCCCCGT GGACAGCGGC GTCGCCGCGG CCTTCCTGCG ATGA

Protein sequence

MSDVVEQLLA RSNTLGADPR NTNFAGGNTS AADTRTDPVT GQDVDLLWVK GSGGDLGTLT 
EDGLAVLRLD RLRALVDVYP GEDREDEMVA AFDHCLFGRG GAAPSIDTAM HGLLRAAHVD 
HLHPDSGIAL ATAADGERLT RECFGDRVVW VPWRRPGFQL GLDIARIAEE NPDAIGAILG 
GHGITAWAET SEQCQANSLE IIRTAEGFLE ENGRPEPFGP VLEGYGALPE AERRQRAAAL 
APVIRGLAST DHPQVGRFTD NDVVLDFLAG AEHPRLAALG TSCPDHFLRT KVRPLVLDLP 
ADAPLERAVE RLRELHGEYR AEYRAYYERH ADADSPAMRG ADPAIVLVPG VGMFSFGKDA 
KTARVAGEFY VNAINVMRGA ESVSTYRPIE ESEKFRIEYW ALEEAKLARL PEPKPLAARV 
ALVTGAASGI GKAIAARLAR EGACVVVADL DADRAAAAAA ELGGSDTAVG VACDVSDADA 
VARAFAAAAL AFGGVDLVVN NAGLSISKPL LETSERDWDL QHDVMAKGSF LVSREAARTM 
TAQGMGGDIV YIASKNAVFA GPNNVAYSAV KADQAHQVRL LAAELGGEGI RVNGVNPDGV 
VRGSGIFAGG WGAQRAKVYG VREEDLGAFY AQRTILGREV LPEHVANAVF ALTAGELSHT 
TGLHIPVDSG VAAAFLR