Gene Noca_3497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3497
Symbol
ID	4595596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3705691
End bp	3707181
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	67%
IMG OID	639778105
Product	glycosyl transferase family protein
Protein accession	YP_924684
Protein GI	119717719
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGCGA ACAGCACGGG TTCGGAGGCG GTGCCGCCGC TCTCGCAGGC GGGGGCCGAC 
AGCCTGCCGT ACGTGCGCAC CGCCGACCCC GGCCTCGCCG CCTACGAGGG CCGGTTCCTC 
GGCGAGGTCG AGGAGCTGCC GACGTACCGC CCGACCGTCG GGTGCATCAT CCCGGCGTAC 
AACGAAGCCG AGACCATCGC CGGCGTCCTG GACTCCCTGC TCCAGCAGAC CCGCCTGCCC 
GACGCGATCC ACGTCATCAT CAACAACACC AGCGACGACT CCGTCGAGAT CGCCAGCCAC 
TACGCCGGCC CGCACACCCG GATGACCCCG TCCGGGGAAC AGAGCACGGT CATCTACGTG 
CACGACATCG GCAAGAACCC CGACAAGAAG GTCGGTGCCC TCAACTACGG CTACTCGCTC 
GTGGAGACGA TGGACTACCT CCTCGGCGTG GACGGCGACA CCACCCCGGA GCCGGACGCC 
ATCGAGCACC TGGTCGACGA GATCGCCAGC GACGACCGGA TCGGCGGCAT CTCCGCGATC 
TACTCGATCG ACGACAGCGC CCTGGACAGC TGGATGGCGA AGTTCCTGAT CGCGGGGCAG 
CGGGCGCAGT TCTCGGCGTT CAACATGCAG AACCTGCTCA AGGGCCGCAA CATGGCGGTC 
CTCGGCGGCC AGTTCTCGAT CTTCTCGACG CAAGCGTTGC GTGACGTGCT GCGCGACAGC 
CACCAGCGCA CCCCGTGGGT CAACGACAGC GAGGTCGAGG ACTCGCTGCT CTCGCTGCAG 
ATCAAGAGCG CCGGCTACCT CACCAAGATC AGCGCCCGGG CCCGCGCGCA CGTCGGCGGC 
ATGGACACGC TGCGCTCGCT GGACGCCCAG CAGGTGAAGT GGAACTTCGG CGCGATCGAC 
CTGATGTGGC CCGGCCAGCG CGGCGACACC AAGGGGCAGC CCTTCCACCC CAACCTGCGG 
CTGCGGTGGT TCGAGCACAT GTCGATGGTC ATCAACATCA CCACCCGCAC GCTGTTCGTC 
CTGCTGCTCG CCGGCTCGCT CAACATCCAC GCGTTCGTGT TCAGCCCGTG GTGGCTGATC 
CCGCCGGCGG CCGCCGTCGG GCTGAACTTC CGCGTGGCCC GGTCGATGGC CTTCGCCAAC 
CGGCGCGACT ACCTCTTCGC GGTGCTGATC GTCCCGGCGG AGGCCTACAT GGTGATCCGG 
ATGGGGCACT TCATCCGGGC CTGGCTGAAG TTCTTCAGTC GGCAGCAGAC CGACAACTGG 
GCCGCCCAGG CCAAGGCCGA GCGCGGCAAG GGCATCGCCT GGACCTACCC CTTCGTCGCG 
TTCGGCGTCA TGTTCGCGGT GTTCGCGGTG GTCTGGACGC AGTTCCTCTC GATCCCGCTG 
CGCTCCGACA TCCTGGCGGT CTGCTGGCCG ATCCTCGGCG TGATCACCGT CCTGCAGACC 
GCCTGGATGA TCATCAAGGC CATGAAGCGC TACCGCGGCT TCAAGGCCTG A

Protein sequence

MNANSTGSEA VPPLSQAGAD SLPYVRTADP GLAAYEGRFL GEVEELPTYR PTVGCIIPAY 
NEAETIAGVL DSLLQQTRLP DAIHVIINNT SDDSVEIASH YAGPHTRMTP SGEQSTVIYV 
HDIGKNPDKK VGALNYGYSL VETMDYLLGV DGDTTPEPDA IEHLVDEIAS DDRIGGISAI 
YSIDDSALDS WMAKFLIAGQ RAQFSAFNMQ NLLKGRNMAV LGGQFSIFST QALRDVLRDS 
HQRTPWVNDS EVEDSLLSLQ IKSAGYLTKI SARARAHVGG MDTLRSLDAQ QVKWNFGAID 
LMWPGQRGDT KGQPFHPNLR LRWFEHMSMV INITTRTLFV LLLAGSLNIH AFVFSPWWLI 
PPAAAVGLNF RVARSMAFAN RRDYLFAVLI VPAEAYMVIR MGHFIRAWLK FFSRQQTDNW 
AAQAKAERGK GIAWTYPFVA FGVMFAVFAV VWTQFLSIPL RSDILAVCWP ILGVITVLQT 
AWMIIKAMKR YRGFKA