Gene Ndas_4408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4408
Symbol
ID	9248283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5244528
End bp	5245697
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	72%
IMG OID
Product	glycosyltransferase, MGT family
Protein accession	YP_003682303
Protein GI	297563329
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACCGCC GCGCCCACAT CGCCATGGTC GGCACCCCCA CCGTGAGCCA CGTCCTGCCC 
AGCCTGGAGG TCATCCGCGA GCTGGTGGAC CGGGGCCACC GGGTCACCTA CGCCAACGAC 
CCCCTGCTGG CCGACACCAT CACCGGCGTC GGGGCCGAAC TCGTCCCCTA CTCCACCATC 
CTGCCCACCG GCGACGGCAC CTGGCCGGAC GACCCGGTCA AGGGCATGGA CATCTTCCTG 
GACGAGGCGA TCAACCAGCT GCCCGCCCTG CGCGCCGCCT ACGACGGAGA CCGTCCCGAC 
CTGTTCCTGT ACGACATCTC GGGGTTCGCC GCCCGGGTCC TCTCCGTCAA CTGGGACATC 
CCCTCCGTGC AGCTCTCGCC CACCTACGTG GCCTGGGCCG ACTACGAGGA CACCGTCCTG 
AAGTGGCTGC GCGCCCAGCC CGGGGCCGAG GAGCACTACG CCAAGCTCGA CGCCTGGCTC 
GCCGACAACG GCGTCACCGG CCTCGACCAC TCCTCCTTCG CCGGGGTGCC GGAGCGGGCG 
CTGGCGCTGA TCCCACGCGA GATGCAGCCC TTCGCCGACA CCGTGGCCGA GACGGTGACC 
TTCGTGGGGC CGTGCCTGGG TGACCGGGCC GACCAGGGCG AATGGACCCG TCCGGCGGAC 
GCCGACAACG TCCTGCTGGT CTCCCTGGGG TCGGCGTTCA CCAACCAGCC GGGGTTCTAC 
CGCGCCTGCC TGGAGGCCTT CGGGGACCTG CCCGGCTGGC ACGTGGTGCT CCAGATCGGC 
AAGTACGTGG ACCCCGCCGA GCTGGGGGAG GTGCCGGGCA ACGTCGAGGT GCACACGTGG 
GTGCCGCAGC TGGCCGTCCT GCGCCAGGCC GACGCCTTCG TCACCCACGC CGGTATGGGC 
GGCTCCAGCG AGGGCCTCTA CACGGGGGTG CCGATGATCG CCGTCCCGCA GGCCGTCGAC 
CAGTTCGACA ACGCCGACCG ACTGGTGGAA CTCGGCGTCG CCCGGAGGAT CGACACCGGG 
GAGGCCAGCG CGGAGCGGCT GCGCTCGGCC CTGCTGGAGC TGACCGCCGA CCCCGGGGTC 
GCCCGCCGCC TCGCCGAGGT CAGCGCCCGG CTCCAGGCCA GCGGTACCTC CTACGCGGCC 
GACCTGGTCG AGGCGGAACT GCCCGCCTGA

Protein sequence

MNRRAHIAMV GTPTVSHVLP SLEVIRELVD RGHRVTYAND PLLADTITGV GAELVPYSTI 
LPTGDGTWPD DPVKGMDIFL DEAINQLPAL RAAYDGDRPD LFLYDISGFA ARVLSVNWDI 
PSVQLSPTYV AWADYEDTVL KWLRAQPGAE EHYAKLDAWL ADNGVTGLDH SSFAGVPERA 
LALIPREMQP FADTVAETVT FVGPCLGDRA DQGEWTRPAD ADNVLLVSLG SAFTNQPGFY 
RACLEAFGDL PGWHVVLQIG KYVDPAELGE VPGNVEVHTW VPQLAVLRQA DAFVTHAGMG 
GSSEGLYTGV PMIAVPQAVD QFDNADRLVE LGVARRIDTG EASAERLRSA LLELTADPGV 
ARRLAEVSAR LQASGTSYAA DLVEAELPA