Gene Noca_0939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0939
Symbol
ID	4597472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	985091
End bp	986479
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	71%
IMG OID	639775542
Product	cystathionine beta-synthase
Protein accession	YP_922149
Protein GI	119715184
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG0031] Cysteine synthase [COG3620] Predicted transcriptional regulator with C-terminal CBS domains
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.44231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACTCAC TCCTCGACCT GATCGGCAAC ACCCCGCTGC TGAGGCTCTC GACGTCCATG 
GGCTCCCTGA ACGGCGCGAA GGGACCGATC GTCCTCGCCA AGGTGGAGTA CCTCAACCCC 
GGCGGCTCCG TGAAGGACCG CATCGCCACC CGGATGATCG AGGCGGCCGA GGCGTCCGGG 
GAGCTTCAGC CCGGCGGCAC CATCGTCGAG CCGACGTCCG GCAACACCGG CGTCGGGCTG 
GCGATGGTCG CCCAGGCGAA GGGCTACAGG TGCGTCTTCG TCTGCCCGGA CAAGGTCAGC 
GAGGACAAGC GCAACGTGCT GAAGGCGTAC GGCGCGGAGG TGGTCGTCTG CCCGACCGCG 
GTCGAGCCGG AGCACCCCGA CTCCTACTAC AACGTCTCCG ACCGGCTCGC CTCGCAGCCG 
GGTGCCTGGA AGCCGGACCA GTACTCCAAC CCGCACAACC CGCGGTCGCA CTACGAGACG 
ACCGGCCCGG AGATCTGGGC GCAGACCGAG GGGCGGGTCA CCCACTTCGT CGCCGGCGTC 
GGCACCGGCG GCACCATCAG CGGCACCGGG CGCTACCTCA AGGAGCAGAA CTCCTCGGTC 
CAGGTCATCG GGGCCGACCC GGCGGGCTCG GTCTACTCCG GCGGCACCGG CCGGCCCTAC 
CTCGTCGAGG GAGTGGGCGA GGACTTCTGG CCGGAGGCCT ACGATCGCGA CGTCGCCGAC 
CGGATCATCG AGGTCTCCGA CGCCGACTCG TTCGCGATGA CGCGGCGGCT GGCCCGCGAG 
GAGGCCCTGC TGGTCGGCGG TTCCTCCGGC ATGGCCGTGC ACGCGGCGGT CCAGCTCGCC 
CACGAGCTCG CCGGCACCCC CGAGGGCGAG GACGCGGTGA TCGTCGTACT CCTCCCGGAC 
TCCGGCCGCG GCTACCTCAC GAAGGTCTTC AACGACGACT GGCTCGCGCA GTACGGATTC 
CCGGTCGACG GCGCCGAGCG CTCCGTGCAG TCCGTCGGGG AGGTGCTCCG CGGCAAGAGC 
GGGCGGCTGC CCGACCTCGT GCACACCCAC CCGAACGAGA CCATCGCCGA AGCCGTCGCG 
ATCCTCCAGG AGTACAACGT CTCCCAGATG CCGGTCGTGC GCGCGGAGCC TCCGGTGGTG 
GCCGCCGAGG TCGTCGGATC GGTCTCCGAG CGGACCCTGC TCGACCTGCT GTTCACCGGC 
TCGGCCAAGC TCACCGACAG CGTCGGCGAG CACATGGCGC CCCCGCTGCC GACGATCGGC 
TCCACCGAGC CCGCCTCCGA GGCCGTCGCC GCACTCGAGG GCGCCGACGC CCTGTTGGTG 
CACGAGGACG GCAAGCCCGT CGGCGTCGTC ACCCGCCACG ACCTGCTGGC CTACCTCGCG 
CGCGGCTGA

Protein sequence

MNSLLDLIGN TPLLRLSTSM GSLNGAKGPI VLAKVEYLNP GGSVKDRIAT RMIEAAEASG 
ELQPGGTIVE PTSGNTGVGL AMVAQAKGYR CVFVCPDKVS EDKRNVLKAY GAEVVVCPTA 
VEPEHPDSYY NVSDRLASQP GAWKPDQYSN PHNPRSHYET TGPEIWAQTE GRVTHFVAGV 
GTGGTISGTG RYLKEQNSSV QVIGADPAGS VYSGGTGRPY LVEGVGEDFW PEAYDRDVAD 
RIIEVSDADS FAMTRRLARE EALLVGGSSG MAVHAAVQLA HELAGTPEGE DAVIVVLLPD 
SGRGYLTKVF NDDWLAQYGF PVDGAERSVQ SVGEVLRGKS GRLPDLVHTH PNETIAEAVA 
ILQEYNVSQM PVVRAEPPVV AAEVVGSVSE RTLLDLLFTG SAKLTDSVGE HMAPPLPTIG 
STEPASEAVA ALEGADALLV HEDGKPVGVV TRHDLLAYLA RG