Gene Saro_1927 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1927
Symbol
ID	3917150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2038957
End bp	2040078
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	64%
IMG OID	640444673
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_497201
Protein GI	87199944
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.109087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGCGC TCCCTGACTG GCGTCGTCAG GAACCGGGGC AGAAGCCCGA ACCGAAGCGC 
GTCGTCGCGA GCCTTCCGCT TGCGCTGCTG CAGCTCGATC CCGACCTCAT CGTGGCCGCG 
GTAAACCCGG CGGCCGAACA ACTCATGGGG CAGGGCGCAC GCCGGATCGT TGGAAAGTCG 
GTCGCAGAAC TGTTCGAATT CGAGGAGCCG CTTATCCTCG GCCGCCTGGC TGAAGGTGAA 
GCCCAACTTT TCGCGCGCGG AGTTGGCGTG CGCATCATGG GGCAGCCCGC GCGACGTTTT 
GACGTGATGA CCAGCCCCGT GACTCATTGC CCCGGCTGGC AGCTCCTGAT GCTTCACGAA 
GGTGTGGGCG TCGAGGCCCT GTCTGGCGAC GGTCGCGGCG CAGGAGGCGG GGAGGGTGTT 
GCTTTGCGCG CACCCGAAGT CCTTGCCCAC GAGATCAAGA ACCCGCTGGC CGGCATAAAG 
GGCGCGGCGC AGCTTCTTGA TCGCAAGCTG TCCGAAAGCG ATCGCGCGAT GACCGGCCTG 
ATCACCGCCG AGGTCGACCG TATCGCCAAA CTGATCGACC AGATGCAGTC GCTTTCCCGG 
CGGAGCGCCG AACCCGCGCA GCCGTGCAAT CTGCACGAAG CTGTCCGCCG GGCCGAAGCG 
GTGCTTGCAG CGGCCAGCCC GGAATCGGTC ACGATCGTCG AGGAGTTCGA CCCCTCGCTC 
CCGCCGATCA TGGCCAATCC GGATTCGCTC GTCCAGGTTC TGCTTAACCT GCTGAGCAAT 
GCGCGCGAAG CCTGCCTCGC CAATGAAGAG CCGCGCATCA TCGTGCGCAC GCGCTTTGCA 
AGCGGCATTC AGCTACATGC CGGCCCCGGT GGAAGGCCCC TTCGCCTGCC TATCGAATTG 
CGCGTATCCG ACAACGGACC GGGTATCGAT CCCACATTGC GCGACCACAT CTTCGAACCC 
TTTGTCACCG CAAAGAAGAA CGGCCAGGGC CTTGGTCTTG CCCTTGTCCA GAAGCTGGTG 
CGAGAGATGA ATGGCCGCAT TACCCATGAT CGCGACGAGG TGGGTGGCTG GACCCATTTT 
CGCATCCATC TTCCTGTCGC CGGATCGGTT CCCACCGAAT GA

Protein sequence

MIALPDWRRQ EPGQKPEPKR VVASLPLALL QLDPDLIVAA VNPAAEQLMG QGARRIVGKS 
VAELFEFEEP LILGRLAEGE AQLFARGVGV RIMGQPARRF DVMTSPVTHC PGWQLLMLHE 
GVGVEALSGD GRGAGGGEGV ALRAPEVLAH EIKNPLAGIK GAAQLLDRKL SESDRAMTGL 
ITAEVDRIAK LIDQMQSLSR RSAEPAQPCN LHEAVRRAEA VLAAASPESV TIVEEFDPSL 
PPIMANPDSL VQVLLNLLSN AREACLANEE PRIIVRTRFA SGIQLHAGPG GRPLRLPIEL 
RVSDNGPGID PTLRDHIFEP FVTAKKNGQG LGLALVQKLV REMNGRITHD RDEVGGWTHF 
RIHLPVAGSV PTE