Gene Noca_3550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3550
Symbol
ID	4599429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3764176
End bp	3765345
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	76%
IMG OID	639778158
Product	glycosyl transferase, group 1
Protein accession	YP_924737
Protein GI	119717772
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGAGG CCACACGGGC GAGGTTCACC CGACATCCAC CTGGCCGCAG CGGCCCGGTC 
ACCCCCCGAG GCGATCCTGA CGACATGCGG ATCGCCCTGG TGACCGAGAC GTTCTTCCCC 
GCAGCGGACG GCACGACGAC GACCGTCAAG GCCGTCGCCG ACCGGCTCGT CGAGACCGGC 
CACGAGGTGC TCGTGGTCGC GCGCGGCCCC GGCCTGGCGT CGTACGGCGG GAGCGAGGTG 
GTCCGGGTCC GCCAGCTGGA CCGGCCCGGC GCGCAGGTCC GCGAGGCGCT CGAGCGGTTC 
GGCCCCGACC TGGTGCACGT CACGTCCCCG GACGCCGTCG GGCGCAAGGC GCTCAAGCAC 
GCCCGCCGGC TCGGCGTCCC CACGCTGGTC GTGGAGCAGT CCGCCCTGAT GGACGTCGCC 
GCCGACTACT GGCGCAGCCG GGTCGCCCGG CGCAGCGACC GCGTGCTGGT GACGTCGCGG 
TGGATGGTGG GCCGCCTGGC CGAGTTCGAG GTCGACGCCG GCCTGTGGCC TCCCGGCACG 
GACCCGGCCG CGTTCACCCC CGCCCTGCGC GACGAGTGGC TGCACGAGCG GTGGTCGCGG 
GCGCGGTCCC GCACCGGCCC CCTGGTCGTC GTGGGGTATG TCGGCAGCCT CCGCAAGCGC 
CACGACGTGC GCCGGCTGGC GGCGCTCGTC CGGGTGCCGG GCATCCGCAC GGTCGTCGTC 
GGCGACGGCC CGCAGCGCGC GTGGCTCGAG GCCCGGTTGC ACGGCGCGAA GTTCACCGGG 
GAGCTCGGCA CCGGCGACCT GGCCGCCGTG CTGCCGACGC TCGACGTGCT GGTCCATCCC 
GGTGAGCACG AGACCTGCTG CCATGCGCTG CGTGAGGCGG CCGCCGCGGG CGTGCCGGTC 
GTCGCGCCGC GCTCGGGCGG CGCTCCAGAC GTGGTGGTGT CCCTCGAGAC CGGCCTCCTC 
TACGACCCGA CCGACGAGCA CGCGCTGGCC CGTGCGGTCG CCGCCATCGC CGCGGACCGG 
CACCGCTCCC TGCTCGGCGC GCGCGCCCGC GAGCTCGCGA CGCGCACCTG GCGACAGGCG 
GTCGACGAGC TCGTGGAGCG GCACTACGTC CCGCTCGCGG CGTCGCGGAG GGCCCCCGGC 
GCGGAGGAGA AGGTCCTGAT TTCTCCGTAA

Protein sequence

MKEATRARFT RHPPGRSGPV TPRGDPDDMR IALVTETFFP AADGTTTTVK AVADRLVETG 
HEVLVVARGP GLASYGGSEV VRVRQLDRPG AQVREALERF GPDLVHVTSP DAVGRKALKH 
ARRLGVPTLV VEQSALMDVA ADYWRSRVAR RSDRVLVTSR WMVGRLAEFE VDAGLWPPGT 
DPAAFTPALR DEWLHERWSR ARSRTGPLVV VGYVGSLRKR HDVRRLAALV RVPGIRTVVV 
GDGPQRAWLE ARLHGAKFTG ELGTGDLAAV LPTLDVLVHP GEHETCCHAL REAAAAGVPV 
VAPRSGGAPD VVVSLETGLL YDPTDEHALA RAVAAIAADR HRSLLGARAR ELATRTWRQA 
VDELVERHYV PLAASRRAPG AEEKVLISP