Gene Noca_1688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1688
Symbol
ID	4599727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1794738
End bp	1796213
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	77%
IMG OID	639776287
Product	GntR family transcriptional regulator
Protein accession	YP_922888
Protein GI	119715923
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.82306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCTGC CGGTCGACCT GGACGCGCGC GCCGACCGGG CGAGCGCGAT CTATCGCGCG 
CTGCTCGAGG CGATCCGCGC CGGCCGGGTC GGTGCCGGTG ACCGGCTGCC GCCGACCCGC 
ACCCTGGCCC GCGACCTGGG GGTCGCGCGC AACACGGTTG CCACCGCGTA CGAGCGGCTC 
GCCGCCGAGG GCCTCCTCGA CGCCCGCGTG GGCGCGGGCA CCTACGTCAC CGACCTGGCC 
GCGCCGGTGC CGGCGCCGCG CCGCCCCGGC TCGCTGCACC CACGGGCCGG CTGGTCGTTC 
CGGCCGCTGC CGGTGAGCGG CGAGCAGCCG GCACCGCCGT ACGACTTCCG GGTCGGCATC 
CCCGACGCGT CGCTGTTCCC GTTCGACACC TGGCGTCGAC TGGTGGCCGC GGAGCTCCGC 
GCCGGGGCGC ACCGCCCGGG CACCTACGCC CACCCAGCGG GCCTGCCGCA GCTGCGGGCC 
GCCATCGTCC GCTACCTCGC CCTGGCCCGC GGCGTCGCAG CCGAGGCCGA CGACGTCGTG 
GTGACCCACG GCACCCAGCA GGCCCTCGAC CTGGTCGCCC GGGTGCTGCT CGAGCCAGGC 
GACGTCGTCG CGGTCGAGGA CCCCGGCTAC CCGTTCGCGC GCGAGCTGTT CGCGTCGCAC 
GGCGCCCGCG TGGTGCCCGT CCCGGTCGAC GCGGAGGGCC TGGTCGTCGA GCGGGTCCCG 
GAGCGGGCCC GGCTGGTGTT CAGCACCCCC TCACACCAGT TCCCGCTCGG TCCGCCGCTC 
TCGCTGGCCC GGCGCCAGGC GCTGCTCGAG CTCGCCAACC GACACCGGGT CGCGATCGTC 
GAGGACGACT ACGACAGCGA GTTCCGGTTC ACCGATCGCC CGCTCGAGAC GCTGCACGCG 
ATGGACCGGC ACGGCCGGGT CGTCTACGTC GGCACCTTCT CGAAGTCGCT GCTCCCGGCC 
CTGCGGGCGG GCTACCTGGT CGCTCCCGAG CCGCTGCGCG AGGCGCTGCT CGGGGCCCGC 
CAGCTGGCGG ACGGCCACGG CGGTCCGGCC GAGCAGGCCG CGCTCGCCCA CTTCGTGGCC 
GACGGGCTCC TCGCCCGGCA CCTCAGGCGG GCTCGGGCGA CGTACGCCGA GCGTCGCGAG 
CTGGTCCGGT CCGGGCTGGA GCGGCTGCTC GCGGACCGCC TCGAGGTGGT CCCGTCGGCA 
GCCGGCCTGC ACGTCGCCGC CACGTTCCGC GACGCCGAGG TCGACGACGC GGCGGTCGCG 
GAGGCGGCGC TGGCGGCCGG CGTCGCGGTC GAGCCGCTCT CGGCGTACGC CGTCGGGCCG 
GACGTCCCGC CGGGCCTGGT GCTCGGCTAC GGCGCCGCAG GCACCGCCAC GATCAGGCCG 
GGTCTGGAGC GGCTCGCCCG GCTCGTCGCG TCCACGCCAT CCAGGCCACC GCGGCCGCGC 
CGACCAGGAG CTGCGGCAGC AGGTAGCGCC CGGTGA

Protein sequence

MDLPVDLDAR ADRASAIYRA LLEAIRAGRV GAGDRLPPTR TLARDLGVAR NTVATAYERL 
AAEGLLDARV GAGTYVTDLA APVPAPRRPG SLHPRAGWSF RPLPVSGEQP APPYDFRVGI 
PDASLFPFDT WRRLVAAELR AGAHRPGTYA HPAGLPQLRA AIVRYLALAR GVAAEADDVV 
VTHGTQQALD LVARVLLEPG DVVAVEDPGY PFARELFASH GARVVPVPVD AEGLVVERVP 
ERARLVFSTP SHQFPLGPPL SLARRQALLE LANRHRVAIV EDDYDSEFRF TDRPLETLHA 
MDRHGRVVYV GTFSKSLLPA LRAGYLVAPE PLREALLGAR QLADGHGGPA EQAALAHFVA 
DGLLARHLRR ARATYAERRE LVRSGLERLL ADRLEVVPSA AGLHVAATFR DAEVDDAAVA 
EAALAAGVAV EPLSAYAVGP DVPPGLVLGY GAAGTATIRP GLERLARLVA STPSRPPRPR 
RPGAAAAGSA R