Gene Ndas_4904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4904
Symbol
ID	9248791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	33885
End bp	34967
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	74%
IMG OID
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_003682793
Protein GI	297563820
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.10792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAGGA CCTCGGCCCG GCTGGCCGAC GGCCGCGAGA TCGTCTACTT CGACGAGGGC 
GACACCGCCC GCGAACCCGC GCCCGACCTG CGCGAGCTGC CCCCGTCCGC GACGGGCGCG 
GAGATGCGCT TCGACCCCCT GCTGCGCGAG TGGGTGGTGG TGGCCTCCCA CCGGCAGGGC 
CGCACCCACC TGCCTTCCAG CCACGACTGC CCGCTGTGCC CCTCGGCGGA GGGGCGCCTG 
ACCGAGGTCC CGGCCGCCTC CTACGACGTG GTCGCCTTCG AGAACCGCTT CCCCTCGCTG 
GTGCGCGATG ACGGTCGCGC CCTGGAGGGG GTCGGGGAGC TGGAGCCGTC CCGGCGCGTG 
GCCGCGGGCC GCTGCGAGGT CCTCGTCTTC GGCTCCGACC ACGACGCGTC CTTCGCCGAC 
CTGGGCCCCG AGCGGGCCCG CACGGTCATG GCCGCCTGGA TCGACCGGAC CGAGGCGCTG 
TCGGCGATGC CGGGCGTGGA GCAGGTGTAC TGCTTCGAGA ACCGGGGGCC CGAGATCGGG 
GTGACCCTGC ACCACCCGCA CGGACAGATC TACGCGTTCC CCTTCGTCAC CCCCCGCACC 
CGGCGGATGC TCGACTCCGC CGAGGAGTAC CGCGAGCGCA CCGGCGGCTC GCTGTTCGCC 
GACGTGCTGC GCGCCGAGCA GGAGGCCGGG ATCCGGGTGG TGGCCAGGAC CGAGCACTGG 
ACGGCCTTCG TCCCGGCCGC GGCCCGCTGG CCCGTGGAGG TGCACCTGTA CCCGCACCGG 
CAGGTGCCCG ACCTGCCCGC GCTGTCGGAG GAGGAGCGCG AGGACTTCGG CCGCCTCTAC 
CTGGACCTGC TGCGCCGCTT CGACGCGCTC TACGACGCGC CCCTGCCCTA CATCTCCGCC 
TGGCACCAGG CGCCCGTGCG CGACCGGCGC GACCTGGCCC ACCTGCACCT GGAGCTGTTC 
TCGGTGCGGC GTGCGCCGGG CAAGCTCAAG TACCTGGCCG GAACCGAGTC CGGCATGGGC 
GCGTTCATCA GCGACGTCGC GCCCGAGACC GTCGCCGAGC GGCTGCGGGA GGTCGCGCCG 
TGA

Protein sequence

MRRTSARLAD GREIVYFDEG DTAREPAPDL RELPPSATGA EMRFDPLLRE WVVVASHRQG 
RTHLPSSHDC PLCPSAEGRL TEVPAASYDV VAFENRFPSL VRDDGRALEG VGELEPSRRV 
AAGRCEVLVF GSDHDASFAD LGPERARTVM AAWIDRTEAL SAMPGVEQVY CFENRGPEIG 
VTLHHPHGQI YAFPFVTPRT RRMLDSAEEY RERTGGSLFA DVLRAEQEAG IRVVARTEHW 
TAFVPAAARW PVEVHLYPHR QVPDLPALSE EEREDFGRLY LDLLRRFDAL YDAPLPYISA 
WHQAPVRDRR DLAHLHLELF SVRRAPGKLK YLAGTESGMG AFISDVAPET VAERLREVAP