Gene Nmul_A0916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0916
Symbol
ID	3786461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1042708
End bp	1043715
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	57%
IMG OID	637810998
Product	AraC family transcriptional regulator
Protein accession	YP_411611
Protein GI	82702045
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATATTC ATATTCTTGC GCTCGACCAG GTTTTCGACA CCGGATTATC AACGCTCCTG 
GACACCCTGA GTATCGCGAA CGATCTCGCG GTTTCTGCCA ACGCAGTGAC ACGATTTGAC 
CTGACGATCG CGGGGGTGCG CCGGAATATT CGTACCAGTC AGGGATTTTC TGTACCGGTA 
GTGCCAGCGG CGCGATGCAG CCCGCCGGAT GTGGTATTGA TTCCGGCGCT TGGGGCAAAA 
ATGCCGGAAA CGCTGCGGTT GGCGCTTGAG CGGCCGGATG TGTGCGAGGC GGGCGACCTT 
TTGCGGCAGT GGTCCAAAGA GGACGTTCTT ATCGGCGCCG CCTGCACTGG AACCTTCGTT 
CTCGCCGATA CTTTGCTTCT CAATGACCGG AGCGCTACCA CATCATGGTG GCTTAGCCCC 
TTGTTTCGGG AACGTTATCC CCGCGTGCGC CTGGAGGAAT CGCGCATGGT GGTAAGCTCG 
CCCGGGTTGG TTACTGCGGG TGCTGCACTG GCACATATCG ATCTGGCGCT TTGGCTCATA 
CGCCAAAGCA GTCCCACGCT CGCAGAAATG ACAGCGCGTT ATCTGCTGAT AGAACCACGA 
GCGTCACAGG CAGTTTTTGC AATTCCTGAT CACCTTGCAC ATGCCGATCC ACTGGTTCAG 
CAATTCGAAC GCTGGGCTCG CCACAGGCTG GGTGAACGTT TCTCCCTGAG CGAAGCAGCC 
AGTGCGACAG GCACAAGCGA GAGAACGCTT TCGCGGCGGC TAAAGGCTGT TCTGGGAAAA 
TCCCCGCTTT CTTATTTTCA GGATCTTCGT ATTGAGCGCG CTGTATATCT CCTGGGGACG 
AGCAACGATA ATGTAGACGC GATTGCTGCC CAGGTGGGTT ATGCGGATGG TACAACCTTG 
CGCACCCTTC TTCGCCGCAG GGTCGGTCGA ACGGTGAGCG AGCTTCGAGC CAGAACCCGG 
GAGATTTCCA GTTCGTTCAA CGACTCTCAA GCACAGGATA TCGAGTGA

Protein sequence

MHIHILALDQ VFDTGLSTLL DTLSIANDLA VSANAVTRFD LTIAGVRRNI RTSQGFSVPV 
VPAARCSPPD VVLIPALGAK MPETLRLALE RPDVCEAGDL LRQWSKEDVL IGAACTGTFV 
LADTLLLNDR SATTSWWLSP LFRERYPRVR LEESRMVVSS PGLVTAGAAL AHIDLALWLI 
RQSSPTLAEM TARYLLIEPR ASQAVFAIPD HLAHADPLVQ QFERWARHRL GERFSLSEAA 
SATGTSERTL SRRLKAVLGK SPLSYFQDLR IERAVYLLGT SNDNVDAIAA QVGYADGTTL 
RTLLRRRVGR TVSELRARTR EISSSFNDSQ AQDIE