Gene Noc_1795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noc_1795
Symbol
ID	3705312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosococcus oceani ATCC 19707
Kingdom	Bacteria
Replicon accession	NC_007484
Strand	-
Start bp	2023839
End bp	2025881
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	48%
IMG OID	637738279
Product	hypothetical protein
Protein accession	YP_343796
Protein GI	77165271
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0505644
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCTACA CAGCGAAAAA TCAGGGCACA GCGGAATCCT TGGAGGACGA CCCTTCTATT 
TTAACGTGGG AACAAATCCT GGAGCAAGAG CGTATGCGCA TCAGGGAGAG GCGCCGCCAG 
GCGGGAATTG CTCTAGGCCA GCCAGAAAAA GATGCGGTAG GGCTGGCTTT TTCGGGTGGC 
GGGATTCGCT CTGCCACCTT TAATCTGGGG TTATTGCAGG CGATGAATCG CTACAGTTTT 
CTTAAGCATG TGGATTATCT TTCCACTGTC TCGGGCGGAG GTTATATTGG CAGTTCCCTG 
ACTTGGTTTA TGTCTTGCCT CAAGCAAGAC TTTCCCTTTG GCGCTTCCCG CCGCGACAAT 
AGGGAAACGC CAGGCGCTAT CGTGAGTTGG CTCCGTCAGC ACGCCTCTTA CCTCACGCCG 
GGTGAGGGGG TGGATCTTTG GGCCTTGGCA GCGGCTATTA TACGGGGCAC CTTGGTTAAC 
TTGCTGGTGA TTATTCCGAT TTTCTTTACT ATAACCGTGC TCTTGGTTTG GTTGCCCGTC 
CCAGTGGTTA TTCCAGGTTA TCCTTGGAAT GGTTTTACCC TGTTGCTAGG AGCAGGCCTT 
GCCTCTCTCG CTCTGCTTGG CGTCACTTCC ATTTTCTATG CTCTATTTTC TAATGTTAGA 
AGCTTACAGC GATTCCGTGT ACGGAGCCGG AGCAATTTCT GGATGGGACG GATGCTGTTT 
TTTGGAATAG GATTTGCGGT GCTCGGTACG ATTCCTCTCT TGCATGGTTA TCTGGAGAGT 
CATTTTAAGG ACTTGATCGA AGAATTTTAT ACCTCTTTTT CCCTGGCTGG GGCGCTATCT 
CTCATGGGTG GCTGGATTGG CCGGGATTCG GAAAACGAGA CTCAGGGCTA TCGCAAGGTT 
TTGTTAAATG TGGGACTAGC TTTGATAATT TATGGTCTTT TGCTATGGAT GTACCATGAT 
GCTGATGCCG TTGTGAACAA GGGTGATGTA GTGAGAGAGG AATTGTTATG GGCAGGCGTG 
GCCTTATCGC TTTTTATTGG TGTGCTAGCC AATATTAACT ATGTCTCTAT CCACCGTTAT 
TACCGGGATC GGCTGATGCA AACATTTATG CCGCCGGTGG GGTTCACTGA TTTTAGGGAA 
CCCAATACAT GTTTGTTAAA AGACATTCCC CAAACCAAAG CCCCCTACCA AATTATTAAT 
ACTATGATGA TGACCTGGAA TTCTTCCACC CCCGCACTGC GGATCAGAGG AGGGGATAAT 
TTTATTTTTA CTCCTTTATT TTGTGGCGCC CCGTCCACCG GCTATGTTCC AAGTGCCCAA 
TACCTGGGTG GCACGATGGA TCTGAGCACC GCCTTTAGTA TTTCGGGAGC TGCCATCGAT 
CCCAATACGG GAGTAACTCG ATCCCGGCCA TTATCTTTTA TGATGACTTT ATTGAACTTA 
CGGATAGGTT ATTGGGTTCG TAATCCAAAG CGGCCTGCCA ATAGGATAAA GGGGTGGTCG 
CGTCCTTATT GGTTTGTCTA CTCCTTGCGG GAAATGCTTG GCCTTAAAAT GGCTGAGAAT 
CAAATGCATG TTTATTTGAC CGACGGAGGC CATTTTGAAA ATTTAGGTCT TTATGAATTG 
GTGAGGCGCC GATGCCGTTA TATTGTGCTT TCCGATGCGG CTGAAGATCG GGCTTGGAAG 
TTTGATGATT TAGGGAATGC CTTGGAAAAG ATTCGGGTAG ATTTTGGTGT AGCTATCGAT 
ATTGATACTC AAATGCTACA ACCTCAGGGT CTTAATCAAT TTTCTCCTCA GCCGGGAGTG 
CTAGGAAATA TTTGCTACGC GGATGGGAGT CGAGGGACTT TACTTTATAT CAAGGCTTCC 
GTTTTTTCCG GACTTCCAGA GGATGTCTAT GCCTACCGGC GGGCTAATCC CAAATTTCCC 
AATCAAAGTA CGGTTGATCA GTTTTTCGAC GAGCCCCAAT TTGAGGCTTA CCGGGAGTTA 
GGCTTTCAAG TAGGCAAGCG AATATTTGAG GATAAAAAAC TCCGTAAAAT TTTTGCTTCC 
TGA

Protein sequence

MSYTAKNQGT AESLEDDPSI LTWEQILEQE RMRIRERRRQ AGIALGQPEK DAVGLAFSGG 
GIRSATFNLG LLQAMNRYSF LKHVDYLSTV SGGGYIGSSL TWFMSCLKQD FPFGASRRDN 
RETPGAIVSW LRQHASYLTP GEGVDLWALA AAIIRGTLVN LLVIIPIFFT ITVLLVWLPV 
PVVIPGYPWN GFTLLLGAGL ASLALLGVTS IFYALFSNVR SLQRFRVRSR SNFWMGRMLF 
FGIGFAVLGT IPLLHGYLES HFKDLIEEFY TSFSLAGALS LMGGWIGRDS ENETQGYRKV 
LLNVGLALII YGLLLWMYHD ADAVVNKGDV VREELLWAGV ALSLFIGVLA NINYVSIHRY 
YRDRLMQTFM PPVGFTDFRE PNTCLLKDIP QTKAPYQIIN TMMMTWNSST PALRIRGGDN 
FIFTPLFCGA PSTGYVPSAQ YLGGTMDLST AFSISGAAID PNTGVTRSRP LSFMMTLLNL 
RIGYWVRNPK RPANRIKGWS RPYWFVYSLR EMLGLKMAEN QMHVYLTDGG HFENLGLYEL 
VRRRCRYIVL SDAAEDRAWK FDDLGNALEK IRVDFGVAID IDTQMLQPQG LNQFSPQPGV 
LGNICYADGS RGTLLYIKAS VFSGLPEDVY AYRRANPKFP NQSTVDQFFD EPQFEAYREL 
GFQVGKRIFE DKKLRKIFAS