Gene Noca_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1914
Symbol
ID	4596361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2041435
End bp	2042727
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	71%
IMG OID	639776512
Product	CBS domain-containing protein
Protein accession	YP_923111
Protein GI	119716146
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGTCT GGCTGCTGCT GGCCGCGGCC GTCCTGGTCG GGCTGGCCGG GCTGTTCTCG 
GCGACGGACG CCGCGGTGTC GTCGTTCTCC CGGGCCCGCG CCGAGGAGCT GCTCGCGGAG 
GGCCGCCCGG GATCGAAGCG GCTGGTCGCG CTGCTCGACG ACCTGCCGCG CTACCTCAAC 
ACCGCGCTCC TGCTGCGCCT GCTGTGCGAG GTCTCCGCGA TCGTGCTGGT CACCCTCGAG 
GCCAGCAGTG CGTACGACGG CCGCGCGTGG CCGACCGCGC TGACGGTGAT CGGCGTGATG 
CTGGTGGTCT CGTTCGTCGC GATCGGCGTC GCACCGCGCA CCCTCGGCCG CCAGCACTCC 
GAGCGGTTCG CGCTGCTCTC GGCCGCGCCG CTGGCCACGG TGACGGCCGT GCTGGGGCCG 
CTGCCCCGGT TGCTGATCCT GGTCGGCAAC GCGCTCACCC CCGGCAAGGG CTTCCGCGAG 
GGGCCGTTCT CGACCGAGAC CGAGCTGCGC GAGCTGGTCG ACCTCGCCGA GGCCTCCGCG 
GTCATCGAGT CCGGCGAGCG CAAGATGATC CACTCGGTCT TCGAGCTCGG CGACACCATC 
GCCCGCGAGG TGATGGTGCC GCGCACCGAT GTCGTCTACA TCGAGCGGCA CAAGAACCTG 
CGCCAGACGC TGTCGCTGTT CCTGCGCAGC GGCTTCTCCC GGGTGCCGGT GATCGGCGAG 
AACCTCGACG ACGTCGTCGG CATCGCCTAC CTCAAGGACA TCGTGCGCCG CGACTTCGAG 
GCGCCCGACG TCGAGTTCAC CGAGCGCATC GACGAGGTGA TGCGCCCCGC GCACTTCGTG 
CCGGAGTCCA AGCCGGTCGA CGGGCTGCTC TCGGAGATGC AGGCCATGCG CCAGCACATC 
GCGGTCGTCG TCGACGAGTA CGGCGGCACC GCCGGACTGG TGACGATCGA GGACGTGCTC 
GAGGAGATCG TCGGCGAGAT CACCGACGAG TACGACGAGG CCACCGTCGA GGTGGAGAGC 
CTCGACGACG ACGCCGTGCG GGTCTCCTCG CGCTACCCGA TCGACGACCT CGACGAGCTG 
TTCGGCTTCG CGGTCGAGGA GGAGGACATC GACAGCGTCG GCGGTCTGAT GGCCAAGCAC 
CTGGGCCGGG TCCCGATCCC GGGCTCGGTG GTCGAGGCGC ACGGCCTGCG GTTCGAGGCC 
GAGGGTGCCT CGGGTCGGCG CAACAAGATC GGCACCGTGC TGATCAGCCG GGTGGGGCCG 
GTCGACGACG AGAACGAGGA GAGCGATGAC TGA

Protein sequence

MSVWLLLAAA VLVGLAGLFS ATDAAVSSFS RARAEELLAE GRPGSKRLVA LLDDLPRYLN 
TALLLRLLCE VSAIVLVTLE ASSAYDGRAW PTALTVIGVM LVVSFVAIGV APRTLGRQHS 
ERFALLSAAP LATVTAVLGP LPRLLILVGN ALTPGKGFRE GPFSTETELR ELVDLAEASA 
VIESGERKMI HSVFELGDTI AREVMVPRTD VVYIERHKNL RQTLSLFLRS GFSRVPVIGE 
NLDDVVGIAY LKDIVRRDFE APDVEFTERI DEVMRPAHFV PESKPVDGLL SEMQAMRQHI 
AVVVDEYGGT AGLVTIEDVL EEIVGEITDE YDEATVEVES LDDDAVRVSS RYPIDDLDEL 
FGFAVEEEDI DSVGGLMAKH LGRVPIPGSV VEAHGLRFEA EGASGRRNKI GTVLISRVGP 
VDDENEESDD