Gene Ndas_3497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3497
Symbol
ID	9247366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4191569
End bp	4192987
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	75%
IMG OID
Product	sigma54 specific transcriptional regulator, Fis family
Protein accession	YP_003681404
Protein GI	297562430
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAGCCC CGCGGTTGCG CGCCTCGTGG CGGCGCAGCG AGCACTACGG CGTCTCCGCC 
GAACGGGTGG AGCCCGCGTT CACCGGTTCC GTGGACACGG AGTCGCTGTT CTACGAGTGC 
GGCAACGAGG TCCTGCGGGG TATCCAGCGG ACCATCGCCA ACGAACCGGT GAGCCTGATG 
ATCACCGACA GCGAGGGGCT GGTGCTGAGC AGGCTCGCCA ACGACGCGGC GATCCTGCAC 
TCGCTGGACC GGGTCCACCT CGCCCCCGGG TTCTCCTACG CCGAACGCGA CGCGGGCACC 
AACGGCCTCG GGCTGGCCCT GGCCGACCGC GCGCCGTCGC TGGTCAGGGC GGAGGAGCAC 
TACTGCACGG GGCTGCGCGG GTACACCTGC GCCGCCGCTC CGGTCCTGGA CCCGTCCGAC 
GGCACGCTGG TCGGCAGCGT CAACCTGACC ACCTGGTCGG AGTCCTCGTC GGCCCTGCTG 
CTGGCGCTGG CCCAGTCCGC CGCGCAGAGC ACGTCCGCGC TCATGCTCGC CCGGGGCACG 
GGACGCCGGG TCCAGCCCGC GCCCAGGGGC GCGGTGTTCC GCTTCCGCGC CGCCGGCGGC 
GGACAGGCCG ACGCCTGCGC GTCGCGGCTC TGGCGCGGCG CCGTCGCCGA GGCCCGCGAG 
GCGGTGGGCG GGCGGACGCT GGCGGTCGTG GGCGAGCCGG GTTCGGGCCG GACCTCCCTG 
GCCTCGCTCG CGCGGCGGCA GGTCAGCGCA CGGGAGAGGG TGCTCAACGC CCGTCCGCCC 
GCCCCGGAGG ACGTGGACTC CTGGCTCACG CTCTGGACCC CCGAGCTGGC CAAGGACGAC 
ACGTGCGTGA TCGTGTCCGG GGTGGAGGCG CTTCCGGCGT GGGGCGCGAG CGAGCTGGCC 
CGGCTGCTGG CCGGGGCGCG GCGCGCGGGT GGGCGCCCCC AGCCCTTCGT GGTCACGGGA 
CGGAGCTTCG ACGCTCTCCC GGAGGCGCTG CGGGAGCTGG TGGACACGGT GGTCGAGGCC 
CCCGCCCTGC GCCGCCGCCC GGAGGACGTG CTGCCGCTCG CGCGGCACTT CGCGCAGGGG 
GCCCGGGGGC GGGCGATCGG CCTCACCCCG GCGGCCTCCC GCGCGCTCAC CGACTACCAC 
TGGCCGGGCA ACGCCACCGA GCTGAAGCGG GCGGTGTGCG ACGCGGCGCA GCGCGCGGAC 
GTGGTCGACG TGCACCACCT GCCCGCCGAG GTCTTCCGCA GCAACGGCGG GCGCCGCCTC 
AGCCGTATCC AGGCCGTGGA ACGCGACGAG ATCGTCCGCT GCCTGACCGC TCCGGGCGCG 
ACCGTCGTCG GGGCCGCCGC CGAGCTGGGG ATGGGACGGG CGACCGTCTA CCGCAAGATG 
CGCCAGTACA ACATCCGGAT GCCCCACCAG CAGGAGTAG

Protein sequence

MKAPRLRASW RRSEHYGVSA ERVEPAFTGS VDTESLFYEC GNEVLRGIQR TIANEPVSLM 
ITDSEGLVLS RLANDAAILH SLDRVHLAPG FSYAERDAGT NGLGLALADR APSLVRAEEH 
YCTGLRGYTC AAAPVLDPSD GTLVGSVNLT TWSESSSALL LALAQSAAQS TSALMLARGT 
GRRVQPAPRG AVFRFRAAGG GQADACASRL WRGAVAEARE AVGGRTLAVV GEPGSGRTSL 
ASLARRQVSA RERVLNARPP APEDVDSWLT LWTPELAKDD TCVIVSGVEA LPAWGASELA 
RLLAGARRAG GRPQPFVVTG RSFDALPEAL RELVDTVVEA PALRRRPEDV LPLARHFAQG 
ARGRAIGLTP AASRALTDYH WPGNATELKR AVCDAAQRAD VVDVHHLPAE VFRSNGGRRL 
SRIQAVERDE IVRCLTAPGA TVVGAAAELG MGRATVYRKM RQYNIRMPHQ QE