Gene Mmar10_1441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1441
Symbol
ID	4285680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	1579104
End bp	1580153
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	638140923
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_756671
Protein GI	114569991
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0722715
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0000363452
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGGCAG CGATCGAACC CAGCGCTGCC GCCCTGGCCG CCGATCAGGC TGCTATCCCC 
ATTCTCATTT TCAGCGACGA GGCGCGCTGT GTCTGGGCCA ATACCCAGGC CGAGGAATGG 
CTCGGCCTGT CGATCCGGAA CATCCGAAAA AGCCGGTTCG GGGAATTGTC GGCTGTCTGC 
GCGCACCTCG CCGACATTGT CGATCAAGCC TGTGATGCGC GCCGGACCCT GGTGGCGCTG 
GGCCGACCAC TGGGCGGGGC CGGGCTCTAT GATGTCCATG CCCGCTGGTC TGACCAGCAT 
GAACAGCTCG CCCTTTCGGT CCTGCCCCAC CAATCCATGG GCGCCAAGGC GTCTGAAGCG 
CCAGCGCTGG GTTTCGGCCG CATGCTCGCG CACGAATTGA AGAACCCGCT GGCAAGCGTT 
CGCGGGGCGG CGCAACTGAT CCGGCGCGAG ACCGAGCTGG AAGGCGCACG TGATCTGGCC 
CGCTTGATCA TCCAGGATGT CGACCGCATC ACCCGGCTGG CTGACCATTG GAGCCGGGTC 
GGCGATATCC GCTTGGGCGA GCAGTCGGAG ATCAATCTCA ACCTGCTGGC AGTGAGTGCG 
ATGGAGAGCC TCAACCGGGC TGATCCGGCC ACGATCGGTG TCCTGCGCGA GAATTTTGAC 
CCATCCCTGC CGTCAATCAA TGGCGATCCG GACCTGCTGA TGCAGGCCGT CCTGAATCTG 
ATCCAGAATG CCTTCGATGC CGTGCGGTCC GATCCCGGCG GGACGATTAC CGTGGAGACC 
CGCTACGATG CCGGTCCACG TAGCCGGTCA AGCGGGCATC CCACGCCGCT GGTCCTCTCG 
GTTCGCGACA ATGGTCCCGG CATTCCGGAA TCGCTCGGAC CGGGTATCTT TACACCGTTT 
GTGACGACCA AACCCGCCGG CGAAGGTCTG GGGCTGGCAT TCGCGGCCCG GATTGCCGCG 
CTGCACGACG GGCAGATCGA CTTTGAAAGC CGCCCGGGAA CCACCGTGTT CAATATCCGC 
CTGCCGATTG CCAAGAAGGA TTTGCCGTGA

Protein sequence

MTAAIEPSAA ALAADQAAIP ILIFSDEARC VWANTQAEEW LGLSIRNIRK SRFGELSAVC 
AHLADIVDQA CDARRTLVAL GRPLGGAGLY DVHARWSDQH EQLALSVLPH QSMGAKASEA 
PALGFGRMLA HELKNPLASV RGAAQLIRRE TELEGARDLA RLIIQDVDRI TRLADHWSRV 
GDIRLGEQSE INLNLLAVSA MESLNRADPA TIGVLRENFD PSLPSINGDP DLLMQAVLNL 
IQNAFDAVRS DPGGTITVET RYDAGPRSRS SGHPTPLVLS VRDNGPGIPE SLGPGIFTPF 
VTTKPAGEGL GLAFAARIAA LHDGQIDFES RPGTTVFNIR LPIAKKDLP