Gene Noc_1703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1703
Symbol
ID	3704625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	+
Start bp	1906186
End bp	1907292
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	50%
IMG OID	637738184
Product	PAS sensor, signal transduction histidine kinase
Protein accession	YP_343705
Protein GI	77165180
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.301457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAGGG AAATTCAGCT GCCTTTCGAG CGGCTATTTG ACACTGCCCC CGATGCCATG 
GTGATCTCTG ATCATCAGGG CCGCATCGTC CTCGTTAACG CCATGGCTGA ACGGATGCTT 
GGCTATTCGC GAGCAGAACT AATAAGCCAG CCTCTTGAGA TTCTGGTACC AAAGCAACAC 
CGCGATGGCC ACGCCCGCCA GCGTCAAAAG TATTATCGTC ACCCCCGCAC TCGCCCCATG 
GGCGAAGGTC GTGAACTCTA TGCAGTACGC AAGGACGGCA GCATGTTTTC GGCCGAGATC 
AGCCTCAGCC CCATGGAAGT AGATGGCCGC TTATTAATTA CGAGCGCTAT CCGAGATATT 
ACGGAACGCA AACAAATACA GAAAACACTA GAACAGCAAA CCCAGGATCT CATGCGCTCT 
AATGCCGAAT TAGAACAATT CGCCTATGTG GCTTCCCATG ACCTCCAGGA GCCGCTTCGA 
ATGGTCAGCA GTTATGCCCA GTTGCTCGCC CGTCGCTACC GGAATCAATT AGACTCCGAT 
GCCGATGAAT TCATCGAGTT CATGGTGGAT GGGGCCACTC GAATGCAGGC ACTCATCAAT 
GACTTGCTCG CTTATTCCCG CGCAGGCACC AAAAATAGAA CTTTTGCCAC AACCAATAGT 
AACGGGGTAG TCCGGCAGGT TCTGGAAAGC CTCCAATTTG TAGTTAAAGA AACTCAGGCC 
TCCCTGACTG TTGATCCTTT GCCCCTGTTA ATAGCAGATG AAGCCCAACT CGCACAACTA 
TTCCAGAACC TCATCAGTAA TGCCTTAAAA TTTCGGGGAG AAACGATACC GAGAATCCAT 
ATTAGCGCTA AAGAGGAAGA GAATGAAATT ATCTTTTCCA TAGCTGATAA CGGGATTGGG 
ATTGAACCTC AATACGCCGA ACGAATTTTT TTACTTTTTC AGCGCCTGCA TAGCAAAAGG 
GAATATCCCG GCACAGGTAT TGGCCTCGCC ATTTGCAAGA AGATCGTGGA ATGTCACGGG 
GGGCGGATTT GGGTAGAATC CAAGCAGGGC AGGGGGGCTA CGTTTTTCTT CACCTTGCCA 
TTCAAACCAG AAAAACCCCT ACCATAA

Protein sequence

MTREIQLPFE RLFDTAPDAM VISDHQGRIV LVNAMAERML GYSRAELISQ PLEILVPKQH 
RDGHARQRQK YYRHPRTRPM GEGRELYAVR KDGSMFSAEI SLSPMEVDGR LLITSAIRDI 
TERKQIQKTL EQQTQDLMRS NAELEQFAYV ASHDLQEPLR MVSSYAQLLA RRYRNQLDSD 
ADEFIEFMVD GATRMQALIN DLLAYSRAGT KNRTFATTNS NGVVRQVLES LQFVVKETQA 
SLTVDPLPLL IADEAQLAQL FQNLISNALK FRGETIPRIH ISAKEEENEI IFSIADNGIG 
IEPQYAERIF LLFQRLHSKR EYPGTGIGLA ICKKIVECHG GRIWVESKQG RGATFFFTLP 
FKPEKPLP