Gene Noca_3302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3302
Symbol
ID	4598174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3508257
End bp	3509477
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	69%
IMG OID	639777908
Product	cell envelope-related transcriptional attenuator
Protein accession	YP_924491
Protein GI	119717526
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0160587
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCGCGA AGCGCCCAAG AACTTCTGGG ACGCGGCACT GGGACAAGGC GGTCCGCCGA 
CGCGCACGTA CGCTGGACGT CCGTGGATCT CGGGAATCCT CTGGAAGGAT CCCCGACGTG 
CCCGACGCGC CGCCCCCTCA TCACCATCGC CGCACCATCC TGCGGGTCAT CCTGGTCGCC 
GAGCTGGTGA TGGCGGTGGT GACCGGGGCG ACGGTCGTGT TCGCCTATCG CCACCTCAAC 
GGCAACATCG AGACGCTGCC GACGATCCAG CACCTCGTCG AGCCGCCCGC GGACGTGGCC 
GACGAGCCGC GCCAGCCGAT CAACGTGCTC GTGATGGGCT CGGACACCCG CGCCTGCGAC 
GGGTGCGGCA TCGACCAGGA GGCCGGCGAG GGCGGCTCGG ACACGACGAT CCTGCTGCAC 
GTCTCGGCCG ACCGAGAGCA GACCTACGGG CTGAGCCTGG CGCGCGACAC GATGGTCAGC 
CGGCCTGCGT GCGAGGTGGA CGGCGAGACC GTTCCCGCGG AGGACCCGGT CATCTTCAAC 
GAGGCGTTCG CGGTCGGTGG TCCGCTGTGC ACCGTGCTCC AGGTCGAGCA CGTGACGGGC 
ATCCACATCG ATCACACCGT CGTCGTGAAC TTCGCGGGGT TCGAGGACAT GGTCGACGCC 
GTGCACGGCG TGGAGGTCTG CGTCCCCAAG CCGGTCGACG CCTACGGCAT CCATCTCGAG 
GCCGGACGCC AGCTCGTGAC CGGCCGCGAC GCGCTCGGCT ACGTGCGCGA GCGGCACGTG 
CTCTCCCCCA ACTCCGACCT CGGCCGGATG AAGCGCCAGC AGGCGTTCAT CGCGTCGATG 
GTCAAGCGGG TGATGTCCGC CGACACGCTC ACGATGCCGA ACCGGCTCTA CAACTTCCTC 
GACGCCGCGA CCAAGTCGAT CCAGGTCGAC AAGGACCTCG CGAGCCTCGG CAAGCTGGTC 
GACCTGGCCC AGCAGTTCAA GGGCGCGGAC CTGAAGAAGA TCAAGTTCGT GACCGTGCCG 
GTCGAGGAGT ACCCCGCCGA CCCCAACCGG CTCCAGTTCG CCCCGGACGC GAAGCAGCTG 
TGGGAGCTGA TCCAGCACGA CCAGCCGCTC GGCAAGTTCG CCAAGGGCGC GATCTCGGCC 
GACGACAAGG TCGGCGACCT CGGCGGCGAC CCGAACGACC CGGACGCGAA GGAACGGCTC 
GCCAACGGGC TGTGCGCCTG A

Protein sequence

MGAKRPRTSG TRHWDKAVRR RARTLDVRGS RESSGRIPDV PDAPPPHHHR RTILRVILVA 
ELVMAVVTGA TVVFAYRHLN GNIETLPTIQ HLVEPPADVA DEPRQPINVL VMGSDTRACD 
GCGIDQEAGE GGSDTTILLH VSADREQTYG LSLARDTMVS RPACEVDGET VPAEDPVIFN 
EAFAVGGPLC TVLQVEHVTG IHIDHTVVVN FAGFEDMVDA VHGVEVCVPK PVDAYGIHLE 
AGRQLVTGRD ALGYVRERHV LSPNSDLGRM KRQQAFIASM VKRVMSADTL TMPNRLYNFL 
DAATKSIQVD KDLASLGKLV DLAQQFKGAD LKKIKFVTVP VEEYPADPNR LQFAPDAKQL 
WELIQHDQPL GKFAKGAISA DDKVGDLGGD PNDPDAKERL ANGLCA