Gene Ndas_5398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5398
Symbol
ID	9249301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	576701
End bp	578224
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	70%
IMG OID
Product	glycosyl transferase family 2
Protein accession	YP_003683283
Protein GI	297564310
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.298595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTACCG CACGTTTCAT AGGCGGCCTG CTGATCGGGC TCATCGCCCT CGCCCTGGCC 
GCGGCACTCT TTGTCTACTG GTTCGGCTAC GCGACGGACG TGGCCGAGGC CTCCGGCCTC 
GGCGCCCTGG GTTACGTGTT CCTGTGGTTG GCCTTCGGCG CCAACCTGCT GCTGTGGACC 
ACCGTCGGAC TCGTGCGCCT GGGCGAGGAC TCGGTGCGCG CCGTGCTCCG GTCACCGCGC 
GCCGGACACC GCGGCGCCGT CGGGGGCGGG GCCCGCGAAC GCGTCCTGGT GGGCGCGGGC 
GGTTCCGGCG GCGCCGCACT CGCCGAGAGG GGCGGCGACG CCTCCGAGGG GGGCGCCTCG 
GCGGCCGTGG CGGCCCGGGC GGAGGGTTCC GGGCGGGAGG TGTCCCTGGC CGTCATCATC 
CCGGCGCACA ACGAGGAACC CGTCATCGGC GGCGCCATCG CCTCCGCCAT GGGGCTGTTC 
GAACGCTGGG ACATCTACGT GGTCTCGGAC TCGTCGAGGG ACTCCACCGC CCAGATCGCG 
GCCAAGACCG GCGTGAACGT CCTCGAACTC CTCGCCAACC GCGGCAAGGC CGGGGCCATC 
GAGGCGGTCA TCGAGGAGTT CTCGCTGACC GACAACTACG ACGGCGTCCT CATCCTGGAC 
GCCGACACCG AGCTCGACCC CGGGTACGTG GAGGGCGCCC GGAGGCAGCT GGCCGACCCG 
TCGGTGGCGG CGGTCGCGGG CTTCGTCGTC TCGGAGTGGA AGCCCGGGGA GCGCGGTTTC 
GTCGGCCGGA TGATCTCGGC CTACCGGGAC CGCCTGTACT TCATGCTCCA GTACCTCATG 
CGCTTCGGGC AGACCTGGCG GCACGCCAAC ACGGCCTTCA TCGTGCCCGG CTTCGCCAGC 
GTCTACCGCA GCGAGGCGCT CAGGGAGATC GACGTCAACC CCAAGGGGCT GGTGATCGAG 
GACTTCAACA TGACCTTCGA GGTGCACCAC AAGCGCCTCG GCAGGGTCTC GATGAACCCC 
GACACCAAGG CCTACAGCCA GGACCCGTTC ACCTTCCGGG ACTACTACAA GCAGGTCACC 
AGGTGGACGC TGGGCTTCTG GCAGACCATC CGGCGCCACC GGGTGTGGCC GAGCCTGTTC 
TGGGCCTGCC TGGCGCTGTA CATCCTGGAG GTGGTCCTGG TCTCCGCCGT GCTGCTGGTC 
ACCACCGTGG TCGGCCTGTT CGTCCTGGCG GGGACGCTGG GCGGCGAGTT CTTCCTGAGC 
CTGCCGTTCG TCGGGGAGGC CTTCACCGCG GTGACGGCCT TCCTGCCGCT GCTGGCGATC 
GCCATCGGCC TGTTCATCCC GGACTACATG CTCACCTGCC TGATGGCGGC GATCCGGCGG 
CGGCCGTCCT ACCTGGTCTA CGGCCTGCTC TTCTTCCCGA TCCGGCTCGT GGACGCCTAC 
CTCGCGCTGC GGATGATCCC CAAGGCGTGG ACCACCGAGT CCGACGGCCG GTGGAGCAGC 
CCGGACCGCG TCTCGGGCAG GTGA

Protein sequence

MRTARFIGGL LIGLIALALA AALFVYWFGY ATDVAEASGL GALGYVFLWL AFGANLLLWT 
TVGLVRLGED SVRAVLRSPR AGHRGAVGGG ARERVLVGAG GSGGAALAER GGDASEGGAS 
AAVAARAEGS GREVSLAVII PAHNEEPVIG GAIASAMGLF ERWDIYVVSD SSRDSTAQIA 
AKTGVNVLEL LANRGKAGAI EAVIEEFSLT DNYDGVLILD ADTELDPGYV EGARRQLADP 
SVAAVAGFVV SEWKPGERGF VGRMISAYRD RLYFMLQYLM RFGQTWRHAN TAFIVPGFAS 
VYRSEALREI DVNPKGLVIE DFNMTFEVHH KRLGRVSMNP DTKAYSQDPF TFRDYYKQVT 
RWTLGFWQTI RRHRVWPSLF WACLALYILE VVLVSAVLLV TTVVGLFVLA GTLGGEFFLS 
LPFVGEAFTA VTAFLPLLAI AIGLFIPDYM LTCLMAAIRR RPSYLVYGLL FFPIRLVDAY 
LALRMIPKAW TTESDGRWSS PDRVSGR