Gene Nmul_A2015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2015
Symbol
ID	3784565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2313198
End bp	2314814
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	52%
IMG OID	637812104
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_412702
Protein GI	82703136
COG category	[T] Signal transduction mechanisms
COG ID	[COG2202] FOG: PAS/PAC domain [COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTGT CCTCCCTTTC TATCGAGTCA TATGCTGAAT CAGAACGCTT TCAGCTATTC 
GTTGCCAGCG TAACTGACTA CGCGCTTTAC ATGCTCAACC CTGAAGGCCG CGTCTGCAGT 
TGGAATGCTG GTGCGCAGAG GTTTAAAGGC TATACGGCTG AAGAAATCAT AGGTCAGCAC 
TTCTCCCGGT TTTATACAGA GGAAGACAGG GCGGCCAATA TTCCATTCAA GGCCTTGCAA 
ACGGCAGCCA AAGAGGGAAG ATTCGAAGAT GAAGGCTGGC GCGTGCGCAA GGATGGCAAT 
CGGTTCTGGG CCAGCATCGT CATTGATCCA ATTCGGGATC CCGAGGGCAT GCTGATTGGT 
TTCGCTAAAA TCACCCGTGA TATTACCGCG CGCAAGAAGG CAACCGAGGC TCTGCACGCC 
AGTGAGGAGC AATTCCGGTT ACTGGTCGAG GGCGTGACGG ACTACGCGCT CTACATGCTG 
TCGGTAGATG GCACCATTAC CAATTGGAAT CCAGGGGCAC GTCGGATTAC TGGCTTCGAT 
CAAACTGAAG CCGTTGGCAC TCATTTCTCC CGCTTTTATA TACAGGAAGA CAAGGCCAAG 
GACTTGCCAT TGGTGGCATT ACAGACTGCG GAAGCGGATG GTCGCTTTGA AGGCGAAGGC 
TGGCGGGTAC GGAAAGACGG CTCCAGGTTT TGGGCAAATG TAGTGATAGA CCCAATTAGA 
AACGCTCTTG GCGAATTGAT TGGTTTTGCA AAAATCACGC GCGATATCAC GGGAAAGCGA 
GAGGCCGAGC AGGCGCTGGA GCGTGCCAAA GAAGCCTTGT TCCAGTCCCA GAAGCTGGAA 
GCGATCGGCA AATTGACGGG CGGGATTGCT CACGACTTCA ATAACCTGCT TAACGTCATT 
GTCAACGGGA TTGAAATCAT TGCAAAGCAA GCACAGACGC CAACTTCCAC CCGGATGCTC 
GAAAGCATGC AGCGCGCAGC CGCTCAGGGG ACGATGTTAA CGCAACAATT GTTGACGTTT 
GCTCGCAAGC AACCCTTAAA GCAAGATAAG TACAATTTGA ATCACGTCAT ACGTTCTTTT 
GAACCGGTAC TTCGCAGAGC CAATAAAGGT TCTGTTGAGT TTGATGTGAA ACTTGATCCG 
CTTTTACCAC CGGTAATCAT CGATGCGCCG CACTTCGAGG CGGCATTATT AAACCTGGTT 
ATCAATGCGC GTGACGCTAC GCCCGATGGG GGCGCTATTA CGTTGAGTAC TGAACAGCTC 
GAACTGGATG AAAAGGAAAT CAATGAGCTG CCAGCAGGAC GCTATGTGAA AGTTACTGTG 
AAAGATACCG GTACAGGGAT GCTGCCGGAA GTAGCGGCCC AAGCCGTGGA GCCGTTCTTT 
ACCACTAAGG AGGTTGGCAA AGGGTCAGGG CTGGGGCTGA GTCAGGTGTA CGGGACGATC 
AAGCAATTCG GCGGGGATAT GGTAATTGAA ACGGCGGTGG GCAAAGGCAC TGCTATTTCC 
CTATTCGTGC CAGCGCTGGA AGGGGATACG AATGAAGGTT CCGGGGGCCT GGCAAGCGGA 
AATGAGAAGG CATTGGTGGT GGATGATCAG GCGGATCTTC TGGAGATCAC CACGTAA

Protein sequence

MTLSSLSIES YAESERFQLF VASVTDYALY MLNPEGRVCS WNAGAQRFKG YTAEEIIGQH 
FSRFYTEEDR AANIPFKALQ TAAKEGRFED EGWRVRKDGN RFWASIVIDP IRDPEGMLIG 
FAKITRDITA RKKATEALHA SEEQFRLLVE GVTDYALYML SVDGTITNWN PGARRITGFD 
QTEAVGTHFS RFYIQEDKAK DLPLVALQTA EADGRFEGEG WRVRKDGSRF WANVVIDPIR 
NALGELIGFA KITRDITGKR EAEQALERAK EALFQSQKLE AIGKLTGGIA HDFNNLLNVI 
VNGIEIIAKQ AQTPTSTRML ESMQRAAAQG TMLTQQLLTF ARKQPLKQDK YNLNHVIRSF 
EPVLRRANKG SVEFDVKLDP LLPPVIIDAP HFEAALLNLV INARDATPDG GAITLSTEQL 
ELDEKEINEL PAGRYVKVTV KDTGTGMLPE VAAQAVEPFF TTKEVGKGSG LGLSQVYGTI 
KQFGGDMVIE TAVGKGTAIS LFVPALEGDT NEGSGGLASG NEKALVVDDQ ADLLEITT