Gene Ndas_3146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3146
Symbol
ID	9247002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3763940
End bp	3765094
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	76%
IMG OID
Product	glycosyl transferase group 1
Protein accession	YP_003681061
Protein GI	297562087
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.833609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGCGAA CTCTGATCAT CACCAACGAC TTCCCGCCCA AGGCCGGTGG CATCGAGGCC 
TTCGTCCACG AGATGGCCCT GCGCCGCCCC CGCGGATCGG TCGTGGTCTA CTGCTCCTCC 
CCCGCCCGGG CCGACGCCGC CGCCGACCCG CACTTCGACC TGCGCCAGCC CTTCCCCGTC 
GTGCGCGACG CCGCACGCGT CCTGCTGCCC ACGCCCCGGG TGGCGCGGCG GGCACGCGCC 
ATCGCCGACC TGGAGGGCTG CGACACCGTG CTCTACGGCG CCGCCGCCCC GCTGGGACTG 
CTCGCCGCCG GGCTGGGCGA GGGCACCCCC GTCAAGCGCC AGGTGGCCAT CAGCCACGGC 
CACGAGACCT GGTGGGCCAC CATGCCCGGA TCCCGCGAGG CGCTGCGCCG CATCGGCGAC 
ACCACCGACA CCGTCACCTA CCTGGGCGAG TACACCCGGC GCCACCTGGC CCGGGCCCTG 
TCCCCCGACG CGGCCGCCCG CATGCGCCGG CTCACGCCCG GCGTGGACAC CGGGGCCTTC 
CGGCCCGGCA CCGGTGGCGA GGAGGTCCGC GCGCGCCTGG GCCTGGGCGA CCGCCCCGTG 
GTGCTGTGCG TGTCCCGGCT CGTACCGCGC AAGGGGCAGG ACACCCTGAT CCGCGCCTGG 
CCCCGCGTCC TGGCCGACGT GCCCGAAGCG GTCCTGCTCG TCGTCGGCGA CGGCCCCCAC 
CGCCGGAGCC TGCTCTCGGC CGCGCGCGGA ATGGACTCGG TGGTCTTCAC CGGCTCGGTC 
CCCCATCGGG ACCTGCCGCC CTACTACGAC GCCGCCGACG TGTTCGCCAT GCCCTGCCGC 
AGCCGCAAGG GCGGCCTGGA GGCCGAGGGG CTGGGCATCG TCTACCTGGA GGCCTCGGCC 
TGCGGCCTGC CCGTGGTCGC GGGCGACTCC GGGGGCGCAC CCGCCACGGT CCGGGACGGC 
GAGACCGGCC TGGTCGTGGA CGGATCCCTG CCCGGCCCCT CCGCGCGCGC CCTCATCGCC 
CTACTGAAGG ACCCCGAGCG CGCCGCCCAG ATGGGCGCAC GCGGCCGCGC GTGGGTGAGC 
CGTGAGTGGA CCTGGGAACA CACCGCCAGG CGCCTGGACG CCCTCCTGGA GGGCTCCCCG 
GACCTGCCCG CCTAG

Protein sequence

MPRTLIITND FPPKAGGIEA FVHEMALRRP RGSVVVYCSS PARADAAADP HFDLRQPFPV 
VRDAARVLLP TPRVARRARA IADLEGCDTV LYGAAAPLGL LAAGLGEGTP VKRQVAISHG 
HETWWATMPG SREALRRIGD TTDTVTYLGE YTRRHLARAL SPDAAARMRR LTPGVDTGAF 
RPGTGGEEVR ARLGLGDRPV VLCVSRLVPR KGQDTLIRAW PRVLADVPEA VLLVVGDGPH 
RRSLLSAARG MDSVVFTGSV PHRDLPPYYD AADVFAMPCR SRKGGLEAEG LGIVYLEASA 
CGLPVVAGDS GGAPATVRDG ETGLVVDGSL PGPSARALIA LLKDPERAAQ MGARGRAWVS 
REWTWEHTAR RLDALLEGSP DLPA